第12章 手搓录取通知书1
第二日,林远被闹钟准时叫醒。
狭窄逼仄的出租单间内,一张床、一张桌子、一把椅子,再无其它的陈设。衣服被随意放在一个打开的行李箱内,满目可及叠放最多的就是各种书籍。
《C语言程序设计》
《嵌入式软硬件设计》
《Java网络编程》
《机器学习入门与实践(Python)》
《电机控制导论》
《机电原理基础》
《PCB设计纲要》
《数字图像原理》
。
。
这些书籍多到桌子上放不下,部分只能被摆在地上。
有些书的封面上是一眼可见的已经散开了底色的笔画,这是林远淘来的二手书。有的书则是排版不齐装订粗糙,这种显然就是盗版。
这总计30多本书涵盖了计算机软硬件以及自动控制领域五花八门的知识,自然不可能在半年内全部看完。林远不仅是挑着学,兼带着还把这些书当作是参考资料库。
至于为什么要弄实体书,而不是用电子书。
因为学习读书不是看小说,实体书的体验是电子书根本无法比拟的。电子书无法达到随手翻阅随时记笔记那种人书合一的质感。
这张桌子除了摆书的地方,其实还留有不少的空白。但是林远日常吃饭或写代码只使用其中很小的一块地方,因为半张桌子都被铺上了绿色防静电台垫。
台垫上头则是一个恒温焊台,两个满是各种小格子组成的元器件料盒,还有镊子、焊锡丝、电路板等各式物件。
这是一个小型手工焊板工作站。功能自然是用来手工贴焊PCB板。
算力系统指引林远入学紫金航院的计算机系,一般来说计算机专业很少有和硬件直接打交道的机会。但是因为涉及到了AI方向,而AI是一个综合性学科,所以也就顺理成章离不开各种电机和电路。
林远本以为这些超出传统计算机知识范畴之外的东西,在面试的时候会有用。却哪知对方根本不认可这种独自在小房间里鼓捣出来的东西。
所幸他最终依靠算力系统的强横来了個“一招破敌”。
入学一事上虽已经获得张教授几乎板上钉钉式的认可,但是系统面板却依然没有结算奖励。
【任务:入学紫金航空航天大学计算机专业。完成度:99.9%。】
林远并不清楚算力系统是如何计算任务完成度的,他权且认为:最后那缺的0.1个百分点,是因为自己还没有收到正式的入学通知书。
当前任务告一段落,在没有新的任务之前,林远只得继续他原先的日常--一是继续学习系统推荐的那些书,二是为了养活自己继续送外卖。
林远看了眼房间角落地上那个明晃晃的黄色头盔,这份工作实在不是什么好差事。
六月的天气眼看就要热起来,到了七八月份,紫金这个大火炉的空气都会仿佛热的沸腾起来,林远光是想想就已经头大。
可是不做这个又能干什么呢?
林远寻思着:不知道紫金航校的研究生入学通知书什么时候到,要是有了那东西,就可以借此去混一份家教。
紫金老三的准硕士研究生,找份家教还是不难的。然后就可以坐在空调间里,靠着一张嘴巴拉巴拉就把钱挣了。
很无奈,林远眼下还是只得捡起了他黄色的“王冠”。
他打开了房门,然后保持了这个动作约摸十秒钟。林远终究是没有迈出去。
try{ggauto();} catch(ex){}
‘我不能被一份通知书制约嘛,不就是一张纸嘛。有它没它我都将是紫金航院的硕士研究生。不如。。。’
林远坐到了电脑前,用搜索引擎开始了检索--图片搜索:紫金航校计算系研究生的入学通知书。
很快,蓝底的硕士入学通知书图片映入眼帘。
不愧是航校,连入学通知书都是蓝天的颜色。
林远忍不住幻想自己接到入学通知书的那一刻,想想就很激动。
但是,此时他先需要手搓一份。
暑假很快就要到了,家教的黄金季节就要来了。林远已经脑补完成了自己的家教简历,就差这一张录取通知书。
录取通知书不是印钞,林远想来应该随便找家广告公司应该就能够打印出来。不就是一张彩印的硬质卡片嘛。
问题就在于电子版的录取通知书不好搞。
网上是可以找到很多相关的图片,在那些图片上用PS改个名字和照片也是很容易的事情。但问题是,如果要追求逼真的话,那录取通知书的色彩以及尺寸还是得尽量准确。
但想从网上检索到的图片中获取通知书各个部位的色彩色号,以及大小尺寸,这并非是一件简单的事情。
首先,哪怕是同一张通知书,不同的人在不同的时候用不同的手机摄像头,都会拍出不同的色号来。
其次,想从图片里面还原出通知书实际的尺寸,也是要费一点功夫的。
林远随后打开了pycharm,他准备用Python祭起爬虫脚本。
学好数理化,走遍天下都不怕。
你看,这个时候就用到了。
为了解决色号的问题,林远打算用爬虫脚本来大批量爬取网上的紫金航校研究生录取通知书图片。然后综合汇总之后做个筛选,再取个平均值。
筛选是必须的。因为这年头拍照用美颜太普遍了,鬼知道会把实物的色号改的如何面目全非。
至于什么是“色号”。顾名思义:就是标识每一种色彩的编号,相当于颜色的身份证。
由于计算机世界的一切数据都是数字,那颜色自然也就不例外。最常见的颜色定义格式就是RGB三基色,R(red)、G(green)、B(blue)红绿蓝三基色可以调制出各种不同颜色。
当然,除此之外还有CMYK、HSB等等。但在计算机世界中,还是RGB格式使用更广。
这个级别的爬虫并不难写。林远只需要爬取某度搜索引擎的搜索结果,然后从中摘取出图片,再通过OCR字符识别过滤一遍,把带有紫金航校研究生录取通知书字样的图片挑选出来。
接着来一个目标识别--将图片中的录取通知书所在区域抠图抠出来。然后再做一份数字图像直方图,就是把录取通知书图片中每种色号做个统计。
接下去再对统计结果做一个排布。就好比跳水比赛的打分,去掉最高分和最低分,取个中间值即可。
这种方式相对简单,其实就是筛选出中间值。
但是这个过程还是涉及了一些计算机和数字图像处理方面的内容,好在如今这个年代得益于摩尔定律的强大推动,计算性能的天花板被一再突破,计算机科学与AI技术发展飞快。
20年前在大型实验室里才能尝试的图像目标识别,如今仅凭一台古董级别的T440就能运行。
当然,这并非是图像目标识别这件事情简单,而是在无数的人开源贡献之下,让这项技术使用起来变得简单。
请记住本书首发域名:wenxueya.cc。文学鸭手机版阅读网址:http://wenxueya.cc