返回第四十七章 开发个app练手  学霸的黑科技系统首页

关灯 护眼     字体:

上一章 目录 下一页

机房里相当冷清,看不到一个人。

毕竟这会儿在放暑假,考研大军们一般也用不上电脑。

走过去打开空调,陆舟随便找了台机子坐下,输入自己的学号和密码,熟练地登录电脑。

之所以选择学校的机房,主要是因为python语言编写的程序主要都是在linux系统下运行,直接在linux环境下学习python语言可以说是一举两得。

而陆舟自己的二手笔记本实在太垃圾了,论文转个pdf格式都得假死一会儿,玩个撸啊撸别人都开始对线了他才站上泉水,装双系统或者虚拟机这些骚操作是不用想的。

“虽然上都讲得很清楚了,没想到这玩意儿用起来这么麻烦果然纸上的东西和实际操作起来完全是两事,想学到东西还是得靠实践啊。”

第一次使用linux系统的陆舟只感觉两眼抓瞎,照着从图馆借来的说明教程看了好一会儿,才算是摸清楚了门道。

不得不说,别人windows系统占据这么大的市场份额还是有道理的,全图型的操作系统即便是完全没碰过电脑的小白,也能很轻松的上手。

然而linux系统却不一样,基本上是命令行操作模式,通过键盘就能完成一切操作。也幸亏学校装的是带有桌面环境的发行版,要不陆舟还真不知道鼠标这玩意儿有啥用。

当然了,linux的优点也很明显,超强的可定制性和安全性使得它比windows系统更适合服务器等领域。而且一旦熟悉了命令行操作,效率将比windows系统高个数倍不止。所以很多企业在招聘服务器前后端程序员的时候都会问一句,会不会用linux系统。

熟悉了linux系统的基本操作,陆舟打开了python软件,翻开了本,坐在电脑面前发呆。

“说到python的运用之一就是编写网络爬虫,想要检验学习成果的话,从这个开始是最好的可是做个什么爬虫呢?”

陆舟不禁陷入了沉思。

爬围脖上的博文?

爬的帖子?

好像挺无聊的。

关键是爬下来的数据拿在手上没用,多了连放的地方都没有。

忽然,他心中一动,不知怎么的就忆起了每次家痛苦的抢票经历。倒不是因为他电脑卡,而是因为铁道部官网的ui设计实在是太反人类了。

“用爬虫技术爬取12306网站的各车站、车次、余票数据信息这个好像可以搞啊。”

一想到这里,陆舟也不再磨蹭了,立刻开始干活。

毕竟作为python语言的一种典型运用范例,爬虫程序的模板在中都是有提到的,而且针对不同种情况,中还针对算法进行了不同程度的改良。

当然了,12306毕竟不是一般bbs论坛,把这个作为初学者的练习目标,还是有不小难度的。

不过也仅仅是不小而已,对于已经吃透了整本的陆学霸来说,问题却是不大。爬虫本身并没有太高的技术难度,不到30行代码就搞定了整个程序,完美运行无bug。

然后紧接着就是抓取了。

将网站的url复制在代码后面,陆舟选择运行,并且将数据生成表格,导入到预先建好的文件夹中。

紧接着机箱的风扇开始嗡嗡作响,电脑变的卡顿起来,一行行编码从黑色的对话框中闪过,被迅速整理进表格中。

看着不断被填充的文件夹,靠在椅子上的陆舟心中感慨。

“python语言真尼玛方便,难怪那么多大牛推荐这玩意儿。”

看着一行行数据闪过的信息,陆舟还真有种过把黑客瘾的错觉。

不过当然了,也仅仅是错觉而已,连感觉都谈不上,毕竟这玩意儿和黑客技术完全八竿子打不着边。从服务器上爬取公开信息是不犯法的,顶多有挤占别人服务器资源的嫌疑,会被各大站长痛恨不已。

所以很多“小气”的网站会设置有反爬虫程序,技术高点的要么让你什么东西都爬不到,要么爬下来的都是乱码,技术含量低的也可以通过访问次数监控,直接锁了你的ip。

本章未完,点击下一页继续阅读。(1 / 2)

『加入书签,方便阅读』

上一章 目录 下一页