辑变成可视化的结构。
他说:“核心思路,是用LSTM网络做时间序列预测,输入是M7过去十分钟的电活动特征,输出是未来五分钟的放电概率分布。当预测到异常放电概率超过阈值时,提前三十秒启动光刺激,而不是等异常出现了再补救。“
“三十秒的提前量,怎么确定的?“
“模拟测试,我们跑了三千组模拟数据,发现三十秒是最佳平衡点,提前量太短,来不及干预;提前量太长,误报率上升。三十秒时,灵敏度和特异性的乘积最大。“
“误报率多少?“
“8.3%,意味着每十二次预测触发中,有一次是假阳性。但假阳性的代价很小,只是多一次光刺激,没有副作用。“
杨平点点头,示意他继续。唐顺果然是一个优秀的复合型人才,他自己居然可以写算法。
唐顺翻到下一页:“硬件优化方面,我把数据维度从原来的二百五十六维压缩到六十四维,用的是主成分分析结合t-SNE降维。精度损失主要来自压缩过程,但我们在模型层面做了补偿,用更深的网络结构来提取特征。“
“训练数据够吗?“
“不够,“唐顺诚实地说,“M7的数据只有五周,样本量很小。我用的是迁移学习,先在大鼠的公开数据集上预训练,再用M7的数据做微调。“
杨平皱眉:“大鼠和灵长类的电活动模式差异很大,迁移学习的效果能保证吗?“
唐顺如实说:“不能保证,所以我在模型里加了一个自适应模块,可以根据M7的实时反馈,动态调整权重。如果迁移学到的特征不适用,模型会逐渐淡化它们,转而依赖M7自己的数据。“
杨平沉默了一会儿。然后他站起来,走到白板前,盯着那张复杂的网络结构图。
“唐顺,你知道这个方案的缺陷在哪里吗?“
唐顺愣了一下。
“缺陷……“他想了想,“自适应模块需要在线学习,这意味着模型会不断变化。变化本身可能带来不稳定性,如果M7的状态突然改变,比如感染、应激、或者药物反应,模型可能来不及适应。“
“对,还有呢?“
“还有……“唐顺的眉头越皱越紧,“LSTM网络的内部状态是黑箱,我们看不到它为什么做出某个预测。如果它错了,我们不知道错在哪里,也就无法手动修正。“
“对,“杨平再次点头,“还有最重要的一个。“
唐顺看着
本章未完,请点击下一页继续阅读!