为什么python爬虫比js火(js爬虫和python爬虫)
js和python那个比较难?
我觉得两个的水差不多深,两者都是入门容易精通困难,正所谓易学难精。js做前端,延伸node.js做后端操作mongodb数据库非常方便,轻量级全栈开发可以考虑这个路线,python主要做后端,可以和多款关系型数据库结合比较好常见mysql比较多,全栈的话学习成本高于javascript。两门都可以做web开发,爬虫,桌面应用等。python比js多了一些应用场景,比如人工智能,大数据等。python在前端分离开发方面比不上js,因为前端有三大框架。总结各有各的优势,水很深学不完的。希望能帮到您。
为什么都说爬虫PYTHON好
选择Python作为实现爬虫的语言,其主要考虑因素在于:
(1) 抓取网页本身的接口
相比其他动态脚本语言(如Perl、Shell),Python的urllib2包提供了较为完整的访问网页文档的API;相比与其他静态编程语言(如Java、C#、C++),Python抓取网页文档的接口更简洁。
此外,抓取网页有时候需要模拟浏览器的行为,很多网站对于生硬的爬虫抓取都是封杀的。这时我们需要模拟User Agent的行为构造合适的请求,譬如模拟用户登录、模拟Session/Cookie的存储和设置。在Python里都有非常优秀的第三方包帮你搞定,如Requests或Mechanize。
(2) 网页抓取后的处理
抓取的网页通常需要处理,比如过滤Html标签,提取文本等。Python的Beautiful Soup提供了简洁的文档处理功能,能用极短的代码完成大部分文档的处理。
其实以上功能很多语言和工具都能做,但是用Python能够干得最快、最干净,正如这句“Life is short,you need Python”。
(3) 开发效率高
因为爬虫的具体代码根据网站不同而修改的,而Python这种灵活的脚本语言特别适合这种任务。
(4) 上手快
网络上Python的教学资源很多,便于大家学习,出现问题也很容易找到相关资料。另外,Python还有强大的成熟爬虫框架的支持,比如Scrapy。

Python和nodeJS哪个更适合做爬虫?
nodeJS当然也可以写爬虫,但我更推荐用Python写爬虫,最主要的原因是库多,requests,xml,beautifulsoup,selenium,scrapy等都是爬虫利器,只要几行代码就可以实现大部分功能。
实际上爬虫写到后面关注的是效率和防爬攻防的问题,如随机headers处理、IP代理池,验证码识别等,需要在这些细节上去考量。
Python和JavaScript 到底选择哪个
Python和Javascript都是脚本语言,所以它们有很多共同的特性,都需要解释器来执行,都是动态类型,都支持自动内存管理,都可以调用eval()来执行脚本等脚本语言所共有的特性。
当然,它们之间也有很大的区别,JavaScript这设计之初是一种客户端的脚本语言,主要应用于浏览器,它的语法主要借鉴了C,而Python由于其优雅、明确、简单的设计而广受欢迎,被应用于教育、科技计算、Web开发等不同场景。
Python和JavaScript都支持多种不同的编程范式,在面向对象的编程上面,它们有着很大的区别。
JavaScript的面向对象是基于原型的,对象的继承是由原型创建出来的,由原型对象创建出来的对象继承了原型链上的方法;而Python则是中规中矩的基于类的继承,并天然的支持多态。