没事就喜欢折腾:放出最新wordpress采集插件。
取名为tiger,源于,今年是本命年–虎年,另外么,既然是采集了,咱也别说高尚了,学小日子本发出’hu,hu,hu!’,扑向珍珠港,扑向万恶的资本主义。
———–邪恶的分割线————————
1:解决了标题重复功能
2:针对雅虎问答的最近改版改进了,依旧没有使用yahoo api.
3:版面重新编排,写的时候懒的切换输出法,所以满屏都是chinglish.
4:除了yahoo answer外,新增加了一个采集源ezine.请自行看ezinearticles.com看版权问题,
5:翻译部分解决了采用了新的php translate wagger,其解决了5000字的限制。但是翻译和采集源之间的关系处理一直没有一个比较好的思路去实现。比如yahoo answer,和ezine的是否都需要翻译。所以暂时增加翻译只有一个步骤。
6:前一个tiger版权的数据库可以自动升级。
7:支持wordpress3.0
8:显示的采集数量为尝试采集的次数,在没有找到解决mysql使用负载前暂时不进行log统计。
———–邪恶的分割线————————
1:采集时间的设定,避免访问高峰期
2:作为一贯传承的风格风格,
3:批量增加关键词功能
4:因为是全新的构架,后期可以实现接口连接模块功能,但是依旧没有处理好feeds采集和其它采集源之间在程序构架上面的关系。不排除后期单独将feeds采集写成一个插件的形式。
5:代理设置
6:伪原创和文章的可读性的平衡
大家谁有这些实现的资料,小生在此求教了。
———–邪恶的分割线————————
权且当成测试吧。虽然也可以用于实际生产环境了。以后整体框架应该不会去变动了。敬请期待更加完善的版权的出现,免费的将只提供现有的这两个采集源,收费方式在于定制其它文章站、新闻站的采集源。
运行环境,wamp和lamp下,wordpress3.0下运行无问题。
请测试php-curl,php-dom组件的安装。
Tiger我安装上了,但是怎么用啊?
不会运行呀 。能告诉我吗?谢谢 啊!
wp的cron機制是要有人訪問才會促發的
添加的关键词。日期都是1970 00:00:00
删除再点击重新添加还是这个日期。采集不了
刚添加就是这样的,
然后我设定一个corn任务每隔一小时检查一下这一个小时内有没有新的词添加进来,如果有的话再给这个词安排添加cron进程。
是不是填加采集关键词以后就不用管了?有人访问网站就会触发采集?还是不管有没有人访问,都会按后台设置的时间来采集?
要有人访问才会触发wp的cron进程的。
另外你注意下服务器环境: crul,php-dom这两个组件必不可少。
呵呵,不好意思。GD的linux主机没有安装这两个组件。哎。好好的插件用不了了。
***********/php.php
能帮我看下我的这个PHP信息里面 是否安装了您说的两个组件呢?
crul这个我看PHP配置文件 提示enable安装的
我有看了curl和dom组件 PHP的配置信息上面都显示的空间商已经安装了。插件还是不能采集。。。。
是有的,等过几天我弄个新的修改版的出来。还有,忙把php.info的拿掉,有安全隐患的;2、做英文站的话最好别告诉人你的地址,毕竟有些被K号的人心理不平衡的。
so,暂时我先把你的地址改掉了.
期待更新。呵呵
我添加了一个采集关键词。后台日期正常了,可是没有采集一篇文章回来。
发布数量(仅为尝试发布数量)*(yahooAnswer):none*(ezine):none下次发布时间:08/29/2010 02:12:01
采集一夜没有成功。我添加的关键词的时候选择的是不翻译。
日语说虎是とぁ(tora),发音为tola,可不是huhu
小弟学疏识浅, 不懂日语.
将就着了.
采集一夜没有成功。我添加的关键词的时候选择的是不翻译。
这东西很久没维护了,但是我自己依旧在使用。你看一下你的服务器环境php-dom php-curl这两个有木有