所以吴忌的课程可其他学生略有不同,很多课他不必上,他的进度更快一些。数学方面的优势让他在物理化学生物方面学起来更高效。
今年波士顿的冬天寒冷潮湿,窗外时常飘着细雨。吴忌拒绝了艾米去佛罗里达度假的邀请,答应了实验室希望他继续参与项目的提议。
吴忌参加的这个小项目,有一名生物医学工程还有隔壁MIT一名计算机的学生,他们三人自发组织的。刚开始是吴忌和MIT的杰森在数学课上认识,一起做了小组作业,然后杰森就邀请吴忌参与一个他组建的项目,当时参与人员0个,吴忌听了他的设想,觉得不错。后来两人又寻找了一个生物工程医学方向的学生,邀请他加入。
杰森呢,是那种典型的IT男生,特别宅,性格也特别不外向,关于寻找项目组员,可怜兮兮的看着吴忌。
吴忌就笑,“你这不挺会撒娇的吗?你就这样看着贝西,她会同意的。”贝西是他俩想邀请的人,是吴忌上生物课时发现这个女生生物学的很好。而且经常在图书馆看到她学习,吴忌觉得贝西可能会对研究项目感兴趣。
杰森摇头,“我邀请过了,她拒绝了。”
吴忌就不解,不应该啊,这是个很好的项目,“你怎么说的?”
“吃饭的时候,我就坐到她面前,和她介绍项目。”杰森皱着眉头,“她没听完,就拒绝了,端着餐盘走了。”
吴忌扶额,“有没有可能,她把你当成骚扰她的人了。”
杰森可怜兮兮都看着吴忌,和吴忌很熟了,“吴,你性格很好,只要和你认识,都会想和你交朋友。拜托了,三人足够。”
吴忌无奈,只能找机会,和贝西沟通这个小项目,基于吴忌的课业非常优秀,是那种很内敛的男生,贝西没觉得被吴忌搭讪有别的企图,一般情况以为是讨论学业,没想到是邀请她参加一个项目。
详细了解后,贝西确实很感兴趣。
课题方向是利用神经网络模型,基于临床指标和基因片段数据,预测特定传染病的爆发趋势与变异可能性。这是交叉学科探索,如果模型有效,数据支撑充分,有冲击SCI期刊的潜力。
里面有医学知识与计算技术,也涉及到基因数据,项目方向是公共卫生,不过,有了好想法,那就干。
项目在他缺席的四个多月里,进度有些迟缓,主要卡在了数据清洗和特征选择的环节,海量的的临床数据和零碎的基因序列数据混杂在一起,如何提取出有效关联特征,并构建合适的输入向量,让其他两人颇为头疼。数学最好的是吴忌,他们需要他,模型需要优化。
吴忌回归后,并没有急着插手具体编码,而是先花了两天时间,仔细研究了团队积累的代码和杂乱的数据集。然后,简化了数据处理流程。
“我们或许可以把问题分解一下,”吴忌在白板上画了一个图,“不必一开始就追求构建能处理所有原始数据的模型。可以先做一层预处理,用相对简单的聚类算法,比如K-ans,依据地理位置、年龄组和几个关键的血常规指标,对病例进行初步分群。然后,对每个群组内的基因片段数据,我们只关注出现频率最高的那几个变异点位,将其作为该群组的特征输入。”
他顿了顿,看向杰森:“这样,输入模型的维度会大大降低,计算复杂度也能控制在我们可以承受的范围内。我们可以先验证这个简化模型在已知爆发周期内的预测准确性,如果有效,再考虑逐步增加复杂性。”
两人若有所思,一致点头,同意!
吴忌补充道:“调试参数试一下,可以的话,再进行下一步。”
为了弥补自己长期缺席的歉意,麻烦的数据处理都交给了两人,吴忌主动提出承包团队接下来一个月的咖啡。当两人得知他缺席是因为亚洲金融危机,做政府的顾问,感觉吴忌很酷。
“吴,你是去和那些金融大鳄过招了吗?”贝西瞪大了眼睛。
吴忌点点头,没有透露太多细节,只是用他们熟悉的数学语言解释道:“本质上也是一场基于数据和模型的博弈。他们利用市场漏洞和恐慌情绪建立攻击模型,我们则需要构建更稳固的防御和反击模型。只不过我们的变量是汇率、利率和资本流动,比基因序列更瞬息万变。”
杰森推了推眼镜,“华尔街那些家伙就像一群嗅到血腥味就疯狂撕咬的鲨鱼。”
吴忌闻言,弯了弯唇角,骂人也不会骂,“鲨鱼至少是自然法则的一部分,维持着海洋生态的平衡。他们……有时候更像病毒,只为了自我复制而摧毁宿主系统。”
他这个比喻引得杰森笑了起来。
模型一直在优化,对比和融合。也不是一帆风顺,总会出