林晚也下定了决心。
周敏直接从上铺跳下来,拖鞋在地上啪的一声响。
“做什么都行啊。人脸识别?现在最火。
自动驾驶?华星肯定感兴趣,他们内部不也有这个项目,如果咱们能在部分检测上有所提高,或许能够直接被收编呢?
或者做个智能客服,企业买单。”
周敏也摸着嘴角,提出了自己那些不靠谱的想法。
“不要。”林晚摇头,“人脸识别已经被人做烂了,那些大公司的模型比我们好一万倍。
自动驾驶,我们连车都没有,怎么做?
智能客服,用户最讨厌的就是智能客服,转人工要转半天。
脾气不好的直接给差评了。”
赵天宇坐下,打开外卖盒:“那你有什么想法?”
林晚此刻也不知道,毕竟大家用的都是华星开源算法,技术上差的不多,主要就是出发点不同。
她滑动鼠标,在计算机里打开一个文档夹,里面是一些回忆。
是一些老照片,她爷爷年轻时的黑白照,褪色泛黄,边缘破损,人脸的轮廓已经模糊得看不清。
奶奶去世前一直说想看清楚爷爷年轻时的样子,但她找遍了网上的修复软件,要么效果太差,要么要付费,要么要上载到云端。
奶奶不懂什么是云端,她只知道把照片发过去,等了好几天,回来的那张脸根本不是爷爷的样子。
“我想做老照片修复。”林晚说,“用AI修复破损、模糊、褪色的老照片。
全部在本地运行,不上载服务器,保护隐私。
速度要快,几秒钟出结果。
效果要好,五官不能变形。”
周敏和赵天宇对视了一眼,然后默默地点了点头。
周敏说:“市面上的老照片修复软件都做得很烂,要么五官变形,要么细节丢失,要么要传云端。
如果能把这个做好……这东西,真的有人需要。
我奶奶手机里存着我爷爷的照片,也是看不清的。”
赵天宇拿出手机,当场下单了一张华星的顶尖显卡,iG1601。
这个今年发布的顶尖显卡,哪怕有着学生优惠,依旧需要7千多块钱。
她平时省吃俭用攒下的钱,再加之拿到的奖学金,瞬间就没有了。
她严重怀疑华星是不是想要借这个赛事,卖自己的显卡。
毕竟开源的AI模型在华星的计算机上就是更加适配一点。
“那就干。今晚开始,通宵。”
周敏负责模型架构。
她翻遍了近三年顶会论文,试了七种不同的超分模型。
每一个模型她都跑了一遍,对比各种指标,最后敲定了一个改进版的Real-ESRGAN。
她在原有架构上增加了人脸专用的感知损失模块,用预训练的人脸识别模型提取特征,让修复后的脸更象本人,同时保留皱纹、痣等个性化特征。
赵天宇负责部署和优化。
他花了两个通宵把模型从PyTorch转成TensorRT,然后用FP16做量化推理,再针对老旧照片的特点做了输入预处理。
去噪、对比度增强、边缘保持滤波。。
其他软件处理一张照片要几十秒甚至几分钟,他们的产品快了一个数量级。
林晚负责数据和前端。
她爬了十万张老旧照片数据集,包括民国时期的证件照、七八十年代的家庭合影、九十年代的旅游照。
她自己写脚本做数据清洗,标注人脸的landrk和修复局域。
她写的前端界面简洁到只有一个按钮——“上载照片”,一个进度条,一个结果展示区。
没有花哨的滤镜,没有多馀的GG,连logo都只放在右上角。
“你是不是太极端了?”周敏看着那个比手机计算器还简单的界面,“好歹加个滤镜效果啊,用户喜欢那种。”
林晚从文档夹里拖出一张破损严重的老照片。
这是一张民国时期的合影,十七个人,最右边的人的脸已经完全糊了。。
十七张脸全部清淅可辨,最右边那个人原本只剩一片灰色的局域,现在居然还原出了五官轮廓。
更神奇的是,衣服上的褶皱、背景里的老式留声机、甚至远处招牌上的字都被模型恢复了出来,虽然有些细节是模型“脑补”的,但看起来非常自然。
赵天宇盯着屏幕看了五秒,说了一句脏话:“操,这也太强了吧。”
初赛提交那天,他们把论文、代码、演示视频打包上载。
视频里,他们修