>>>亿推标准化英文推广第23式:采集<<< 采集,也就是网站内容自动采集,是google所不鼓励的,但对于内容营销来说,是有意义的。
国内的dedecms系统,可以搭配蜘蛛侠,是一个比较好的解决方案。但也存在一些重大问题:
1. 只能支持采集到单站。
2. 采集到的文章在归类到不同栏目的时候,功能比较弱。
3. 不支持根据关键词判断文章是否采集的功能
如果你做的是一个英文站群,就应该对 以上方案 做一些代码改动,以便于支持采集到多站功能。
采集的时候,最好在虚拟服务器设置脚本,定时执行。
对于英文文章的采集,需要留意断词模式和中文是不同的,比如SEO这个词,在某些文章内是动词,如果你替换成search engine optimization 的话,就会出现歧义。
~~~ 想和小二直接交流的,可以度娘一下“亿推标准化” ~~~
(整理: ACN Newswire 全球发稿 韩国媒体发稿 日本媒体发稿 新加坡媒体投放 大中华区发稿 亚洲发稿推广 澳大利亚软文发稿 美国软文投放 全球发稿投放 路透社发稿 雅虎新闻发稿 ) |