wordpress
wordpress采集插件tiger
七 16th
没事就喜欢折腾:放出最新wordpress采集插件。
取名为tiger,源于,今年是本命年–虎年,另外么,既然是采集了,咱也别说高尚了,学小日子本发出’hu,hu,hu!’,扑向珍珠港,扑向万恶的资本主义。
———–邪恶的分割线————————
1:解决了标题重复功能
2:针对雅虎问答的最近改版改进了,依旧没有使用yahoo api.
3:版面重新编排,写的时候懒的切换输出法,所以满屏都是chinglish.
4:除了yahoo answer外,新增加了一个采集源ezine.请自行看ezinearticles.com看版权问题,
5:翻译部分解决了采用了新的php translate wagger,其解决了5000字的限制。但是翻译和采集源之间的关系处理一直没有一个比较好的思路去实现。比如yahoo answer,和ezine的是否都需要翻译。所以暂时增加翻译只有一个步骤。
6:前一个tiger版权的数据库可以自动升级。
7:支持wordpress3.0
8:显示的采集数量为尝试采集的次数,在没有找到解决mysql使用负载前暂时不进行log统计。
———–邪恶的分割线————————
1:采集时间的设定,避免访问高峰期
2:作为一贯传承的风格风格,
3:批量增加关键词功能
4:因为是全新的构架,后期可以实现接口连接模块功能,但是依旧没有处理好feeds采集和其它采集源之间在程序构架上面的关系。不排除后期单独将feeds采集写成一个插件的形式。
5:代理设置
6:伪原创和文章的可读性的平衡
大家谁有这些实现的资料,小生在此求教了。
———–邪恶的分割线————————
权且当成测试吧。虽然也可以用于实际生产环境了。以后整体框架应该不会去变动了。敬请期待更加完善的版权的出现,免费的将只提供现有的这两个采集源,收费方式在于定制其它文章站、新闻站的采集源。
运行环境,wamp和lamp下,wordpress3.0下运行无问题。
请测试php-curl,php-dom组件的安装。
wordpress采集插件 修复
三 5th
我是个很懒的人,发现yahoo answer改变了页面结构,却在三天后才去修改插件。
改完插件二十四小时后才迟迟将其放上,不多说了,wordpress采集插件修复版本:yahooAnswers1.1
这应该是对这个插件的最后一次修复完善了,再接下来是号称,注意:仅仅是号称:tiger的全新采集插件。
采集源除了传统的ya外加上answer、article等待,外加随机发布时间等功能。
预计猛虎出笼时间在四月一号,愚人节哈。欢迎大家申请内测,我会随时公布最近进展和发布测试版。
诸如有对百度知道进行采集并翻译成英文等想法的同鞋也可以将你的建议说下。我会认真考虑的……
并同时我尽量坚持写下插件开发时的一些注意事项,希望不愿付费购买的同学也能跟据这个教程自己学会用php针对某个站点的采集了。
当然,附上免责条款:以上一切是基于我有足够可供支配的时间上的。
and:请尊重版权,发布这些只为进行技术性学习的目的,勿用于商业及其它用途,由此产生一切纠纷概不负责。
>>>>>>>>
说这话的时间感觉自己很像岳不群
Wating for tiger…
***************************
ya修复版插件点此下载:yahooAnswers1.1
wordpress和drupal的比较
八 27th
wordpress和drupal的比较:
wordpress作为一个博客是很称职的,有众多优秀的插件可以选择,但是毕竟是天生做为blog而存在的,如果要做企业站、资讯站或者是行业平台站点的话,有些功能的实现并不是很完美,甚至要很吃力地找相应的插件。
drupal则是我的另外一个选择,强大的可扩展性让他几乎无所不能。看了一个用drupal搭建的山寨开心网,160+的插件构建了一个强大的sns,这是让我震惊的。不足之处在于国内相关的讨厌和中文文档不如wordpress齐全,开发文档之类的就只能边用翻译软件看了。
关于这两个软件说是有个美国有个社区组织放弃wordpress而采用drupal,wordpress的开发者专门为此写邮件给他们,得到的答复是因为数据量大了,网站访问效率出现问题。
带给我的错觉
wordpress和drupal都是优秀的程序,为什么给我的感觉是wordpress是初级的,drupal是高级的?是因为自己写过wordpress的主题和插件,而drupal至今却没有弄懂他的模板函数吗?应该还是自己没花时间了。
开始使用drupal
不管怎么样,现在我得开始使用drupal,因为公司要弄一个新的网站然后搞seo,链接分类这些麻烦事好像用drupal可以轻松搞定。
在学校上广告学的时候应该看过这个视视频,没错,是个广告,不是天天扭扭屁鼓扭扭腰的今年过年不送视。是那种有创意、有情节的甚至带来给你的感动不输于某些大片的广告。看这种广告,叫做欣赏:
wordpress 采集插件 2
八 13th
小生写的wordpress采集插件竟然有人赏识,不免小小得意一番。
不过好像是自己太懒了,只弄了五个关键词。
于是把关键词改成了二十个,并且将发布的频率进一步增加。最短弄成了一分钟,希望这么短的时间不会造成cpu使用过高。
下一步,想弄个从英语翻成德语,再翻成法国鸟语,最后翻回英语,以避免采集所造成的版本问题,准备就是采用截取google translate的结果进行多次反复翻译,只是不知道可读性最后会变成什么样。
或者,看了下淘宝客的demo,好像搞个淘宝客的站点也是不错的选择。也就基于blog,总觉得blog和wiki在seo方面有先天性的优势。
选择无疑是一个充满史诗般浪漫的悲壮过程。
网站转移记1
八 4th
网站转移记1
一个垃圾站所在的空间的月流量限制在3G,上个月用了2.8G左右,这个月今天才5号,流量已经接近0.5G了,意味着我必须在两个星期内将站点转移,否则流量将要超标。
下载文件,上传到新的服务器,一切都OK。唯一的问题在于数据库。
wordpress里面有近万篇文章,数据库在服务器上显示为40M,下载下为是8.8M。这一些步骤还没有问题,当我尝试将数据库导入新的虚拟主机上时,由于网速的原因,一直不能顺利上传,即使上行带宽可以达到40K/s,phpmysql还是提示我超时。
据说ssh的话就可以直接在一台虚拟主机上从另外一台下载东西,这样就不用先下到自己电脑再上传这么麻烦了。
或许该去花钱买个带ssh的虚拟主机,或者弄个vps,超便宜的那种vps,10美元一个月。
just a log
七 25th
花了一天时间,初步仿了一个gmail格式的wordpress主题,估计还得花上一天去完善,并对主题做相应的seo优化。下一步就是将其axaj化,这个还得花上一天的时间。时间真的不够用啊。
这个主题对adsense做了相当多的空位。目的么就是用在英文站。
just so so.
做了很多半途而废的东西的,现在都把它们给完善起来。
努力……为了钱。
魔兽世界开放了下载器http://wow.163.com。打开后却是跳出没有找到下载源的对话框。真不知道这场纠纷什么时候能结束,去玩台服也是一个不错的选择,人民币升值之下,月卡只要80-90块钱了。
wordpress采集插件制作思路
七 2nd
wordpress采集插件的制作思路:
找到百度知道这种形式的站点,使用搜索,得到浏览器函数……并根据这个设定关键词和函数,首先得到的是文章列表,取得文章列表的链接并进入文章,取得文章名这些信息,根据文章名比较是否已经存在了这个话题……如果没有则进入下一步:文章入库。
wordpress采集插件的营利方式:
1:做英文站
看上去好简单啊……从采集的应用来说:yahoo answer是个不错的选择,做英文站的google adsense单价比较高。争取用周六周日完成这个插件……
2:卖插件
好像也可以考虑卖插件,国外的采集插件都是二三十美刀地在卖的,我也可以考虑一下这个……