<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>
<channel>
	<title>Комментарии к записи: RC RSS Облом или Как Обломать Копипастера</title>
	<atom:link href="http://www.chanishvili.org/rc-rss-oblom/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.chanishvili.org/rc-rss-oblom/</link>
	<description>О вебпрограммировании вообще, и о WordPress в частности</description>
	<pubDate>Fri, 21 Nov 2008 22:21:44 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.6</generator>
		<item>
		<title>Автор: Роланд Чанишвили</title>
		<link>http://www.chanishvili.org/rc-rss-oblom/#comment-440</link>
		<dc:creator>Роланд Чанишвили</dc:creator>
		<pubDate>Thu, 17 Jul 2008 16:41:07 +0000</pubDate>
		<guid isPermaLink="false">http://www.chanishvili.org/rc-rss-oblom/#comment-440</guid>
		<description>&lt;b&gt;sonika&lt;/b&gt; я не могу спорить с красивыми женщинами  :oops:

А вот яндекс - еще как может! :)  Так что смотрим выдачу по &lt;a href="http://yandex.ru/yandsearch?text=%D1%81%D0%BF%D0%BE%D1%80%D1%82&#038;from=fx3&#038;lr=187" rel='nowork' rel="nofollow"&gt;спорт&lt;/a&gt; и &lt;a href="http://yandex.ru/yandsearch?text=c%D0%BFop%D1%82&#038;from=fx3&#038;lr=187" rel='nowork' rel="nofollow"&gt;cпopт&lt;/a&gt; и удивляемся :) 

P.S. Кроме яши есть еще и гугля, например :)
</description>
		<content:encoded><![CDATA[<p><b>sonika</b> я не могу спорить с красивыми женщинами  <img src='http://www.chanishvili.org/wp-includes/images/smilies/icon_redface.gif' alt=':oops:' class='wp-smiley' /> </p>
<p>А вот яндекс - еще как может! <img src='http://www.chanishvili.org/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />  Так что смотрим выдачу по <a href="http://yandex.ru/yandsearch?text=%D1%81%D0%BF%D0%BE%D1%80%D1%82&#038;from=fx3&#038;lr=187"  >спорт</a> и <a href="http://yandex.ru/yandsearch?text=c%D0%BFop%D1%82&#038;from=fx3&#038;lr=187"  >cпopт</a> и удивляемся <img src='http://www.chanishvili.org/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>P.S. Кроме яши есть еще и гугля, например <img src='http://www.chanishvili.org/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: sonika</title>
		<link>http://www.chanishvili.org/rc-rss-oblom/#comment-437</link>
		<dc:creator>sonika</dc:creator>
		<pubDate>Thu, 17 Jul 2008 14:25:31 +0000</pubDate>
		<guid isPermaLink="false">http://www.chanishvili.org/rc-rss-oblom/#comment-437</guid>
		<description>Первый пункт — ерунда, т.к. например яндекс прекрасно понимает слова, где русские буквы заменены похожими английскими и считает такие слова одинаковыми…</description>
		<content:encoded><![CDATA[<p>Первый пункт — ерунда, т.к. например яндекс прекрасно понимает слова, где русские буквы заменены похожими английскими и считает такие слова одинаковыми…</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Nick</title>
		<link>http://www.chanishvili.org/rc-rss-oblom/#comment-427</link>
		<dc:creator>Nick</dc:creator>
		<pubDate>Tue, 15 Jul 2008 12:22:24 +0000</pubDate>
		<guid isPermaLink="false">http://www.chanishvili.org/rc-rss-oblom/#comment-427</guid>
		<description>Да, очень хороший плагин.</description>
		<content:encoded><![CDATA[<p>Да, очень хороший плагин.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: mephi</title>
		<link>http://www.chanishvili.org/rc-rss-oblom/#comment-418</link>
		<dc:creator>mephi</dc:creator>
		<pubDate>Fri, 11 Jul 2008 17:38:26 +0000</pubDate>
		<guid isPermaLink="false">http://www.chanishvili.org/rc-rss-oblom/#comment-418</guid>
		<description>Классный плагин, как тока посажу свой новый блог, обязательно постучусь:)</description>
		<content:encoded><![CDATA[<p>Классный плагин, как тока посажу свой новый блог, обязательно постучусь:)</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Roland</title>
		<link>http://www.chanishvili.org/rc-rss-oblom/#comment-389</link>
		<dc:creator>Roland</dc:creator>
		<pubDate>Tue, 17 Jun 2008 20:59:42 +0000</pubDate>
		<guid isPermaLink="false">http://www.chanishvili.org/rc-rss-oblom/#comment-389</guid>
		<description>Это у тебя умный способ, а меня грабят по простому - взять что отдается в rss и тупо у себя запостить :)  Поэтому грабилка никак не вычисляется.</description>
		<content:encoded><![CDATA[<p>Это у тебя умный способ, а меня грабят по простому - взять что отдается в rss и тупо у себя запостить <img src='http://www.chanishvili.org/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />  Поэтому грабилка никак не вычисляется.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Дачник-цветовод</title>
		<link>http://www.chanishvili.org/rc-rss-oblom/#comment-388</link>
		<dc:creator>Дачник-цветовод</dc:creator>
		<pubDate>Tue, 17 Jun 2008 19:12:37 +0000</pubDate>
		<guid isPermaLink="false">http://www.chanishvili.org/rc-rss-oblom/#comment-388</guid>
		<description>Я может неправильно сформулировал вопрос.

Предположим, есть обычная грабилка

Импортируем ленту, в цикле регуляркой вырезаем адреса, проходим по ним и обратно, при помощи регулярки - грабим контент страницы, удаляем теги и ссылки и заново форматируем текст и пишем его в базу.
При формировании своей страницы - описание формируем из основного текста, путем вывода N количества знаков и формируем ссылку на страницу.
Это типичный алгоритм грабинга контента.

Чтобы устроить клоакинг, то бишь отдать пользователю и поисковому роботу один контент, а грабилке - другой - нужен алгоритм вычисления грабилки.</description>
		<content:encoded><![CDATA[<p>Я может неправильно сформулировал вопрос.</p>
<p>Предположим, есть обычная грабилка</p>
<p>Импортируем ленту, в цикле регуляркой вырезаем адреса, проходим по ним и обратно, при помощи регулярки - грабим контент страницы, удаляем теги и ссылки и заново форматируем текст и пишем его в базу.<br />
При формировании своей страницы - описание формируем из основного текста, путем вывода N количества знаков и формируем ссылку на страницу.<br />
Это типичный алгоритм грабинга контента.</p>
<p>Чтобы устроить клоакинг, то бишь отдать пользователю и поисковому роботу один контент, а грабилке - другой - нужен алгоритм вычисления грабилки.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Roland</title>
		<link>http://www.chanishvili.org/rc-rss-oblom/#comment-387</link>
		<dc:creator>Roland</dc:creator>
		<pubDate>Tue, 17 Jun 2008 14:51:07 +0000</pubDate>
		<guid isPermaLink="false">http://www.chanishvili.org/rc-rss-oblom/#comment-387</guid>
		<description>Дачник, а ЗАЧЕМ вычислять бота? Фишка то в том что юзеру все равно виден вполне читаемый текст, а на ботов положить, ибо бот копипастера нам неинтересен, а боту гугля\яши мы отдали вполне приличный текст, с ссылками и правильными анкорами :)</description>
		<content:encoded><![CDATA[<p>Дачник, а ЗАЧЕМ вычислять бота? Фишка то в том что юзеру все равно виден вполне читаемый текст, а на ботов положить, ибо бот копипастера нам неинтересен, а боту гугля\яши мы отдали вполне приличный текст, с ссылками и правильными анкорами <img src='http://www.chanishvili.org/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Дачник-цветовод</title>
		<link>http://www.chanishvili.org/rc-rss-oblom/#comment-386</link>
		<dc:creator>Дачник-цветовод</dc:creator>
		<pubDate>Tue, 17 Jun 2008 13:48:00 +0000</pubDate>
		<guid isPermaLink="false">http://www.chanishvili.org/rc-rss-oblom/#comment-386</guid>
		<description>Я честно говоря, так и не понял, как автор вычисляет бота, что бы ему, что-то отдать. Нет времени писать грабилку, чтобы проверить, что отдается. Сам контент не ворую, потому, готового под рукой нет, а жара, размягчает мозги и придает мыслям ленность.
Однако, от автора, хотелось бы услышать некоторые подробности.

Каким образом вычисляется бот или юзер. Так, на вскид - либо кукой, либо явой. 
Второй вопрос - какой контент отдается роботам поисковиков, и как они дифференцируются от ботов грабилок?</description>
		<content:encoded><![CDATA[<p>Я честно говоря, так и не понял, как автор вычисляет бота, что бы ему, что-то отдать. Нет времени писать грабилку, чтобы проверить, что отдается. Сам контент не ворую, потому, готового под рукой нет, а жара, размягчает мозги и придает мыслям ленность.<br />
Однако, от автора, хотелось бы услышать некоторые подробности.</p>
<p>Каким образом вычисляется бот или юзер. Так, на вскид - либо кукой, либо явой.<br />
Второй вопрос - какой контент отдается роботам поисковиков, и как они дифференцируются от ботов грабилок?</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Roland</title>
		<link>http://www.chanishvili.org/rc-rss-oblom/#comment-385</link>
		<dc:creator>Roland</dc:creator>
		<pubDate>Tue, 17 Jun 2008 00:09:51 +0000</pubDate>
		<guid isPermaLink="false">http://www.chanishvili.org/rc-rss-oblom/#comment-385</guid>
		<description>У многих для этого мозгов нету. Как и на то чтобы свой текст написать. 

Вот и приходится "помогать" им таким способом :)</description>
		<content:encoded><![CDATA[<p>У многих для этого мозгов нету. Как и на то чтобы свой текст написать. </p>
<p>Вот и приходится &#8220;помогать&#8221; им таким способом <img src='http://www.chanishvili.org/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Дачник-цветовод</title>
		<link>http://www.chanishvili.org/rc-rss-oblom/#comment-384</link>
		<dc:creator>Дачник-цветовод</dc:creator>
		<pubDate>Mon, 16 Jun 2008 03:53:53 +0000</pubDate>
		<guid isPermaLink="false">http://www.chanishvili.org/rc-rss-oblom/#comment-384</guid>
		<description>Воровство - проблема! Парсерами вытягивают не только с лент, но и с сайтов, и вешают все, даже не обрабатывая синонимайзерами. По поводу ссылок - так ведь вырежут, для этого, много не надо - пару строчек кода и все.</description>
		<content:encoded><![CDATA[<p>Воровство - проблема! Парсерами вытягивают не только с лент, но и с сайтов, и вешают все, даже не обрабатывая синонимайзерами. По поводу ссылок - так ведь вырежут, для этого, много не надо - пару строчек кода и все.</p>
]]></content:encoded>
	</item>
</channel>
</rss>
