火车头采集器怎么采集一个内容页的两个内容?

提示:
用火车头怎样采集当前文章的url网址
提示:

火车头采集器怎么采集一个内容页的两个内容?
这就需要你的经验了,寻找内容2和内容7与其它内容不一样的地方,然后根据这个不同点进行规则采集。 比如内容2和内容7的开头和结尾都有一个符号x、y,而其他内容没有,那么你就可以对内容标签编辑规则,采集从x开头到y结尾的内容,这样就可以把内容2和内容7采集到了。 还有就是用正则表达式来采集,这个需要你对正则表达式有一定的了解和要求。
用火车头怎样采集当前文章的url网址
要能采集网址的火车头,必须是7版以上的,以下的版本无法办到。首先创建一个标签为本文网址,勾选后面的“从网址中采集”。选择下面的“正则提取”,点击通配符“(??)”,这样在窗口中就显示为(?[\s\S]*?)我们再在它前加一个与字符串开始的地方匹配的符号^,又在它后面加一个与字符串结束的地方匹配的符号$,这样就变成了^(?[\s\S]*?)$。如图: 我们来解释下意思Content 代表内容? 表示匹配0次或者1次\s 匹配所有空白字符\S 匹配所有非空白字符* 修饰匹配次数为 0 次或任意次