项目的选题是他自己定的,数据挖掘方向,
用爬虫抓取某音乐平台的公开接口数据,做创作者行为模式分析。
这种选题在计算机系的课程作业里很常见,
数据量大,模型简单,出图漂亮,答辩的时候容易讲清楚。
他写好爬虫脚本之后跑了一晚上,第二天早上起来看结果。
数据落在Excel表格里,按照创作者ID排列,
每一行是一个匿名词曲人的作品发布记录,
包括发布时间戳和作品时长以及平台标注的风格标签。
他随手翻了几页,翻到一个ID的时候停了一下。
夜声。
这个名字他听过。
去年有一首歌在各个平台的榜单上挂了三个月,歌手唱的,但词曲署名栏只有两个字:夜声。
当时他在宿舍放过那首歌,苏晏正好在旁边,
听了几秒说了一句这歌写得不错,然后继续写作业了。
方砚没在意。
现在他盯着夜声的发布记录,开始看时间规律。
这个创作者的活跃度不算高,平均每个月一到两首新作品。
但发布时间的分布很集中。
百分之八十三的作品是在凌晨一点到三点之间上载的。
方砚把这个数据单独拉出来,做了一个柱状图。
柱状图的型状在凌晨两点的位置形成了一个尖峰,两侧急剧下降,到早上六点之后几乎归零。
典型的夜猫子型创作者。
方砚看了一眼这个图,没什么特别的感觉。
然后他顺手柄发布日期也拉了出来,按月排列了一下。
排完之后他的目光在屏幕上多停了几秒。
他回头看了一眼苏晏的床。
苏晏不在宿舍,出去了,桌上的计算机处于休眠状态,指示灯一亮一灭地闪着。
方砚重新转回自己的屏幕。
他在想一件事。
上个月有一周苏晏连续四天凌晨三点以后才关灯,
方砚有一天起来上厕所的时候看到他还坐在桌前,戴着耳机,屏幕的光映在他脸上,表情专注。
方砚问他在干嘛,他说失眠。
那一周是十月的第三周。
方砚把目光移到屏幕上夜声的发布记录。
十月第四周,夜声发了一首新歌。
从密集熬夜到新歌发布,间隔是七天。
方砚又往前翻了两个月。
八月中旬,苏晏有一段时间早课迟到了三次,
方砚帮他签了两次到。他问原因,苏晏说在赶一个东西,没细说赶什么。
八月下旬,夜声发了两首歌。
方砚把苏晏的异常作息时间段和夜声的发布时间做了一个简单的交叉表格。
数据跑了三十秒。。
方砚盯着那个数字看了很久。。
他把椅子往后推了一点,后背靠在椅背上,两只手交叉抱在胸前。
他的脑子里有一个念头正在成形。
苏晏是夜声。
这个念头刚冒出来就被他自己否定了一半。
他转头又看了一眼苏晏的桌面。
桌上放着一本翻了一半的线性代数课本,课本旁边是一支普通的中性笔,笔帽上有咬痕。
书架上插着几本二手教材,书脊的颜色褪了一部分。桂子初生傍月香
床上的被子叠得不算整齐,枕头旁边扔着一副三十九块钱的有线耳机,耳机线缠在一起打了一个结。
苏晏穿的衣服方砚都见过,T恤大多是基础款,
最贵的一件外套是去年双十一在网上买的,打完折两百出头。
一个月入十五万以上的顶级词曲人,住四人间宿舍,穿两百块的外套,用三十九块的耳机。
方砚摇了摇头。
想多了。
他关掉了分析页面,把数据存进了项目文档夹的子目录里,文档名打的是原始数据备份。
晚上七点苏晏回了宿舍,手里提着两份食堂打包的饭菜,一份放在方砚桌上。
“吃了吗?”
“没呢。”
方砚打开饭盒,米饭上面盖着红烧茄子和一个煎蛋,茄子的酱汁浸到了米饭里,把白米染成了浅褐色。
他夹了一块茄子放进嘴里嚼着,嚼了两口突然开口。
“苏晏。”
“恩。”
苏晏坐在自己的位子上,打开了他那份饭菜的盖子,热气从饭盒里升起来。