*** Aborted at 1509437177 (unix time) try "data -d @1509437177" if you are using GNU date ***
训练过程中出现上图错误。初步猜想是数据集的原因。重新下载了lmdb数据,等待测试。
训练过程中有保存迭代10000次时的snapshot,所以我试着从这个节点恢复训练,目前已经顺利的进行13000次迭代了,训练还在继续。所以我还是不知道到底是哪里出了问题,但是现在模型又可以正常训练了。
等过了今晚,看看是否还正常吧。
要崩溃了!!! 程序又停了。
这次出现了Bus error, 据群里的一个大神说,这是主板问题。 好吧,我要崩溃了。
=================================================================================
问题解决:下载的lmdb数据有问题,不完整。 data.mdb完整大小是202.8G
同时也说明,caffe在读取训练数据了,即便从snapshot处开始,仍然是从lmdb数据开头重新读取的。