wordpress 采集插件
磨叽了这么久,终于初步搞定了wordpress的采集,插件的思路可见以前的一篇文章。
放到网上,有需要建英文垃圾站的同志、朋友们可以帮我测试下。
后台加载插件,然后输入你选定的关键字(注意这个wordpress的采集插件的采集源是yahoo answer所以关键词只能是英文),
设定发布频率、分类、是否即时发布这些选项就可以。
下载的大大留个邮箱,以便出了新版本可以通知大家。
只需要三分钟,给你一个垃圾站!
不多说,看下载英文雅虎问答采集插件
wordpress 采集插件
相关日志
- wordpress采集插件制作思路 (0)
- wordpress采集插件 修复 (23)
- 西天也许有;空想前往,又有何用 (0)
- 列表 (0)
- wordpress采集插件tiger (0)
| 打印文章 | 这篇文章由止戈于2009年07月28日 7:23 下午发表在代码如诗。你可以订阅RSS 2.0 也可以发表评论或引用到你的网站。 |
没有引用
wordpress采集插件tiger
大约2周前 - 没有评论
没事就喜欢折腾:放出最新wordpress采集插件。
取名为tiger,源于,今年是本命年–虎年,另外么,既然是采集了,咱也别说高尚了,学小日子本发出’hu,hu,hu!’,扑向珍珠港,扑向万恶的资本主义。
———–邪恶的分割线————————
1:解决了标题重复功能
2:针对雅虎问答的最近改版改进了,依旧没有使用yahoo api.
3:版面重新编排,写的时候懒的切换输出法,所以满屏都是chinglish.
4:除了yahoo answer外,新增加了一个采集源ezine.请自行看ezinearticles.com看版权问题,
5:翻译部分解决了采用了新的php translate wagger,其解决了5000字的限制。但是翻译和采集源之间的关系处理一直没有一个比较好的思路去实现。比如yahoo answer,和ezine的是否都需要翻译。所以暂时增加翻译只有一个步骤。
6:前一个tiger版权的数据库可以自动升级。
7:支持wordpress3.0
8:显示的采集数量为尝试采集的次数,在没有找到解决mysql使用负载前暂时不进行log统计。
———–邪恶的分割线————————
1:采集时间的设定,避免访问高峰期
2:作为一贯传承的风格风格,
3:批量增加关键词功能
4:因为是全新的构架,后期可以实现接口连接模块功能,但是依旧没有处理好feeds采集和其它采集源之间在程序构架上面的关系。不排除后期单独将feeds采集写成一个插件的形式。
5:代理设置
6:伪原创和文章的可读性的平衡
大家谁有这些实现的资料,小生在此求教了。
———–邪恶的分割线————————
权且当成测试吧。虽然也可以用于实际生产环境了。以后整体框架应该不会去变动了。敬请期待更加完善的版权的出现,免费的将只提供现有的这两个采集源,收费方式在于定制其它文章站、新闻站的采集源。
在此不具名感谢很多采集插件,让我汲取了很多精华。
点此下载:tiger1.3.4!!!
运行环境,wamp和lamp下,wordpress3.0下运行无问题。
请测试php-curl,php-dom组件的安装。
相关日志
列表 (0)
wordpress采集插件制作思路 (0)
wordpress采集插件 修复 (23)
西天也许有;空想前往,又有何用 (0)
网站转移记1 (1)
wordpress全新采集插件tiger alpha版本公布测试
大约2月前 - 8个评论
wordpress全新采集插件tiger alpha版本公布测试
feature:
tiger 1.0 alpha
模块化设计,便于后期整合。
以插件形式放于modules子文件夹内,
目前主要的子插件为老版本的yahoo answer采集、翻译以及feeds整合。
1:ya采集部分暂时未使用yahoo的api接口,后期考虑修改。
2:翻译目前支持翻成四种语言,可以选择全部输出或者只输出最后一种语言。
3:feeds整合部分的翻译功能暂时写死,无论采集的原文是何种语言,进行自动判断并输出英文。
3:因为测试中,代码中有很多语言并未优化,可能造成较高的内存占用。
4: 测试版本可以自由开发演绎。
5:以后通用版本的重点开发在feeds模块,
6:如果有兴趣者多,准备写下api文档。
7:参照了众多wp的采集类插件并抄了不少代码,@_@,翻译部分采用了Google Translation PHP wrapper;在于表示专心的感谢。
!全部功能处于测试阶段,不能用于现实生产环境。
ps: alpha版本主要为功能测试,界面中只有增加关键词/feeds url选项,而无修改,删除。
不保证正式版本对此版本的数据提供升级维护
我只是个卖菜刀的,至于你拿菜刀去杀人还是杀猪我管不了,由此带来的一系列问题请自负–使用条款只有这么一条
开发环境为php5.2.11 mysql3.0+,
任何疑问请直接留言,但是不保证正式版本的公布时间。
插件下载地址tiger
相关日志
wordpress采集插件 修复 (23)
wordpress 采集插件 2 (6)
wordpress 采集插件 (14)
wordpress采集插件 修复
大约4月前 - 23个评论
我是个很懒的人,发现yahoo answer改变了页面结构,却在三天后才去修改插件。
改完插件二十四小时后才迟迟将其放上,不多说了,wordpress采集插件修复版本:yahooAnswers1.1
这应该是对这个插件的最后一次修复完善了,再接下来是号称,注意:仅仅是号称:tiger的全新采集插件。
采集源除了传统的ya外加上answer、article等待,外加随机发布时间等功能。
预计猛虎出笼时间在四月一号,愚人节哈。欢迎大家申请内测,我会随时公布最近进展和发布测试版。
诸如有对百度知道进行采集并翻译成英文等想法的同鞋也可以将你的建议说下。我会认真考虑的……
并同时我尽量坚持写下插件开发时的一些注意事项,希望不愿付费购买的同学也能跟据这个教程自己学会用php针对某个站点的采集了。
当然,附上免责条款:以上一切是基于我有足够可供支配的时间上的。
and:请尊重版权,发布这些只为进行技术性学习的目的,勿用于商业及其它用途,由此产生一切纠纷概不负责。
>>>>>>>>
说这话的时间感觉自己很像岳不群
Wating for tiger…
***************************
ya修复版插件点此下载:yahooAnswers1.1
相关日志
列表 (0)
wordpress采集插件制作思路 (0)
wordpress采集插件tiger (0)
WordPress插件编写 (2)
wordpress 采集插件 2 (6)
web ceo之optimization advice and analysis
大约8月前 - 1个评论
web ceo
web ceo 是款强大的seo软件,放在电脑上也已经有个把年头,因为原先做的项目都是中文站,而web ceo对中文的支持并不友好,除了submit rss的功能外一直处于冷热未使用状态。
最近终于有机会开始尝试着英文站点的优化,在使用这个软件的过程中,印象最深的功能是optimization advice and analysis。
许多概念在原来操作时只是有一个大概的数,比如title标签字数要小于多少多少个字,descriptions要如何编写,关键词需要加粗。
web ceo使用了具体的数字来分析你创建的页面,主要分为:
optimization advice
这部分又分为general page properties和On-the-page factors influencing your ranking
general page properties部分:目前我的站点只出现了url的提示:
Your keyword isn’t present in the URL! Our research of hundreds of search engines top-lists shows that keyword presence in the URL is crucial for achieving high rankings in a search engine’s results list. By placing keywords 更多 >
西天也许有;空想前往,又有何用
大约11月前 - 没有评论
西天也许有;空想前往,又有何用
苏东坡临死时说的
不想自己死的时候重复这句话。
努力了,放弃幻想,脚踏实地。
垃圾站50M的数据库,计划在昨天转移完成的,却因为地震导致了光缆中断无法进行操作,今天却马上恢复了正常,有人说是将路由进行转移过的原因。用上帝国备份王,顺利地转移了数据。下一步就是将采集的关键词恢复正常的,等等google adsense的帐号到达$100试下会不会被K号。
垃圾站采用新页面主题的优化和采集关键词的恢复大致需要两天时间,两天后就可以和老姐搞国内的东西了。谁让我是一个被穷疯的人呢。
高手的后续:很庆幸,我没有丧失思考的能力与思考的空间。他说的和我平常了解的也没有什么区别,区别在于有没有用心去做。当然,周日在茶馆里面的交流和这两天在网上的沟通以及看了他写的seo方案,触到还是挺大的,至少我一直所想要的系统性思维我就没做好。当然最重要的一点,他毕竟现在在做浙江在线的seo工作,所以整个思维的高度也和我的不一样。
相关日志
wordpress采集插件制作思路 (0)
收到adsense pin码 (0)
我不认输 (5)
小结 (0)
列表 (0)
wordpress 采集插件 2
大约11月前 - 6个评论
小生写的wordpress采集插件竟然有人赏识,不免小小得意一番。
不过好像是自己太懒了,只弄了五个关键词。
于是把关键词改成了二十个,并且将发布的频率进一步增加。最短弄成了一分钟,希望这么短的时间不会造成cpu使用过高。
下一步,想弄个从英语翻成德语,再翻成法国鸟语,最后翻回英语,以避免采集所造成的版本问题,准备就是采用截取google translate的结果进行多次反复翻译,只是不知道可读性最后会变成什么样。
或者,看了下淘宝客的demo,好像搞个淘宝客的站点也是不错的选择。也就基于blog,总觉得blog和wiki在seo方面有先天性的优势。
选择无疑是一个充满史诗般浪漫的悲壮过程。
英文Yahoo Answers wordpress采集插件
相关日志
wordpress采集插件 修复 (23)
网站转移记1 (1)
列表 (0)
wordpress采集插件制作思路 (0)
wordpress采集插件tiger (0)
just a log
大约1年前 - 没有评论
花了一天时间,初步仿了一个gmail格式的wordpress主题,估计还得花上一天去完善,并对主题做相应的seo优化。下一步就是将其axaj化,这个还得花上一天的时间。时间真的不够用啊。
这个主题对adsense做了相当多的空位。目的么就是用在英文站。
just so so.
做了很多半途而废的东西的,现在都把它们给完善起来。
努力……为了钱。
魔兽世界开放了下载器http://wow.163.com。打开后却是跳出没有找到下载源的对话框。真不知道这场纠纷什么时候能结束,去玩台服也是一个不错的选择,人民币升值之下,月卡只要80-90块钱了。
相关日志
wordpress采集插件制作思路 (0)
西天也许有;空想前往,又有何用 (0)
列表 (0)
web ceo之optimization advice and analysis (1)
adsense优化3 (0)
wordpress采集插件制作思路
大约1年前 - 没有评论
wordpress采集插件的制作思路:
找到百度知道这种形式的站点,使用搜索,得到浏览器函数……并根据这个设定关键词和函数,首先得到的是文章列表,取得文章列表的链接并进入文章,取得文章名这些信息,根据文章名比较是否已经存在了这个话题……如果没有则进入下一步:文章入库。
wordpress采集插件的营利方式:
1:做英文站
看上去好简单啊……从采集的应用来说:yahoo answer是个不错的选择,做英文站的google adsense单价比较高。争取用周六周日完成这个插件……
2:卖插件
好像也可以考虑卖插件,国外的采集插件都是二三十美刀地在卖的,我也可以考虑一下这个……
相关日志
西天也许有;空想前往,又有何用 (0)
just a log (0)
收到adsense pin码 (0)
列表 (0)
infolinks影响adsense单价 (1)
大约1年前
俄,博客要采集做什么啊?
大约1年前
建垃圾站啊,国内流行的,开动火车头,dede数据入库这样的。
大约1年前
只是用wordpress当cms的载体了,也许在你的思维里博客是自己一个个码出来的,那么你就别把采集的站当成博客,它只是一个垃圾站点,虽然用的是你钟爱的wordpress.
大约11月前
这个插件只能加五个关键字?
再多的关键字就列不出来了..还是根本就添加不上了.
http://www.boangs.com 今天测试了一下,同时采集多个关键字容易报错.
大约11月前
可以加的,只是发布出来的只弄了五个,嫌麻烦,因为有一些bug,而且最近工作比较忙,没有解决,有空改好了再发布。
我不知道你那边是什么错误,我自己用的时候目前权发现采集时间上会出现1969年的错误,删了重新发布关键词就可以了。
看了你的英文站:
1、做英文站要低调,在国内发布了英文站的网址容易被人恶意点,到时候你就有苦说不出来了。
2、用英文版的wordpress,界面很多是中文的,最好不要挂adsense广告,万一因为版权被封号你就完了。
大约11月前
@止戈
谢谢提醒哈.呵呵
大约11月前
能不能把俺的网址屏一下哇.你说的我都怕了…..@止戈
大约11月前
为什么我改了代码
add_option( ‘deeYaPostNum6′, 0 );
add_option( ‘deeYaPostNum7′, 0 );
add_option( ‘deeYaPostNum8′, 0 );
add_option( ‘deeYaPostNum9′, 0 );
add_option( ‘deeYaPostNum10′, 0 );
同时改了
add_option( ‘deeYaMax’, 30 );
没效果哦,还是只发布五个,显示五个,对PHP不是很熟悉.
@止戈
大约11月前
网址已经改成了你的个人博客,还是小心点好
你那样操作是没有问题的,我刚改了下,呆会儿进行测试,好了再放上来
大约10月前
太厉害了
正在学习使用wordpress中
大约10月前
还有个问题啊
就是为什么你说”用英文版的wordpress,界面很多是中文的,最好不要挂adsense广告,万一因为版权被封号你就完了。”
这是什么意思?我用的是中文版,然后做英文站可以吧?
大约4月前
留一下邮箱先。
大约4月前
下载了不能用,提示第几行错误,然后下了个英文版的,提示431行错误啊。
大约4月前
http://blog.dengruo.com/201003/883
新的插件地址