设为首页
收藏本站
切换到宽版
用户名
Email
自动登录
找回密码
密码
登录
注册
快捷导航
论坛
BBS
排行榜
Ranklist
搜索
搜索
热搜:
香港vps
香港VPS
amh
机柜
vps
分销
VPS
域名出售
火车头
云主机
不限流量
香港服务器
美国服务器
香港
全能空间
whmcs
digitalocean
本版
帖子
用户
MJJ论坛
»
论坛
›
技术交流分享
›
Web技术
›
有人能搞出這樣子的源碼嗎?
1
2
/ 2 页
返回列表
楼主:
skwinx
有人能搞出這樣子的源碼嗎?
[复制链接]
cnweb
cnweb
当前离线
积分
21074
发表于 2010-11-30 23:49:14
|
显示全部楼层
做這個玩意
沒有點美元或人民幣是不可能的撒
回复
支持
反对
举报
liheyuan
liheyuan
当前离线
积分
1560
发表于 2010-12-1 00:15:07
|
显示全部楼层
爬这么多有啥用么。。我一直就很不解。。垃圾站的意义是什么?除了赚点钱。。
你搞几个机器在你本地爬,一周能爬好几十T的。
回复
支持
反对
举报
drivel
drivel
当前离线
积分
3655
发表于 2010-12-1 01:04:21
|
显示全部楼层
对于中文网页,要正确的读出 encode 的方式
可以从网页头部,HTTP header 读出,然后 decode 一下
回复
支持
反对
举报
drivel
drivel
当前离线
积分
3655
发表于 2010-12-1 01:10:26
|
显示全部楼层
另外,这样做最大的问题在于截图如何经济有效的存贮和调用
毕竟是文件,不能使用现成的一些 Map/Reduce 或者 NoSQL 之类的数据模型
回复
支持
反对
举报
狒狒
狒狒
当前离线
积分
1720
发表于 2010-12-1 07:01:04
|
显示全部楼层
提示:
作者被禁止或删除 内容自动屏蔽
回复
支持
反对
举报
狒狒
狒狒
当前离线
积分
1720
发表于 2010-12-1 07:05:22
|
显示全部楼层
提示:
作者被禁止或删除 内容自动屏蔽
回复
支持
反对
举报
moto72
moto72
当前离线
积分
19652
发表于 2010-12-1 07:15:59
|
显示全部楼层
nutch 开源的
回复
支持
反对
举报
qqpcc
qqpcc
当前离线
积分
5676
发表于 2010-12-1 08:53:02
|
显示全部楼层
一个很不错的想法,但你可能得为些付出一辈子的努力。
因为你的想法……,可能不是一个人的财力、精力……能完成的。
回复
支持
反对
举报
1
2
/ 2 页
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
美国VPS综合讨论
干货茶馆
美国虚拟主机交流
Archiver
|
手机版
|
小黑屋
|
MJJ论坛
Copyright
MJJ论坛
© 2022 All Rights Reserved.
快速回复
返回顶部
返回列表