Бывшая порнозвезда пересела на VW Polo
Бывшая порнозвезда Саша Грей, отправившаяся в автопробег по России на «Ладе Калине», была вынуждена пересесть на VW Polo, т.к. российский автомобиль сразу сломался.
“Нам не привыкать к таким визитам в ремонтные мастерские. Машина была осмотрена, к убитой передней подвеске (левая стойка всё, чашка правой стойки тоже всё и там по мелочи), чек-энджену (причина не ясна) добавилась течь коробки передач — надо опять менять прокладку. Болты на коробке у нас расходятся не в первый раз”, — так написано в блоге автопробега.
“Калина объективно не готова, она в плохом состоянии, и сегодня это стало очевидно всем. Машина сама подала сигнал. Пора прислушаться. Наша авантюра, конечно, прикольная, но жизнь дороже. (…) Из Владивостока нам пришло указание, что надо поберечь здоровье заграничной гостьи, поскольку отремонтировать машину в Хабаровске быстро не получится, и ситуация с запчастями там такая же, как во Владивостоке (запчастей нет), то не стоит играть в рулетку на «федералке». Места там безлюдные, всякое бывает. (…) Из центрального офиса написали, что хватит выпендриваться и ездить на поломанной машине”.
P.S. Характерна и оценка автомобиля, данная Сашей Грей после попытки дрифтинга на «Калине»: «Мои реальные ощущения — это не машина, а кусок говна».
http://drugoi.livejournal.com/3845274.html
- (0)
2013, Приватизация!
Мы, простые москвичи, не в курсе многого интересного, что происходит вокруг. Власти – тоже (одни озабочены отловом очередного хищения на сумму, ставшую бы причиной отставки любого европейского Президента, другие – получением взятки в соответствующем размере). Все при деле. Но поскольку красть становится… ну, не то, чтобы неприлично, не та страна, но – просто уже нЕчего – подскребают кусочки. Остатки ваучерной приватизации 1992-го. Причём весьма оригинально. Вот пример.
Упал мне тогда, 20 лет назад, кусочек московского ГПЗ-2. Кто знает – место приятное, Шаболовка, бывший подшипниковый завод, превратившийся как и другие московские заводы, полностью или по большей части, в бизнес-центр. Катают там не подшипники, а бабло.
И ТЫ ТУДА ЖЕ? все происходит не по нашей воле:)
Длинная преамбула.
Я не знаю, как это называется. Это не дежа-вю. Дежа-вю – это когда у тебя стойкое ощущение что с тобой уже происходило, что ты это уже где-то видел. Это не ощущение тревоги. Это не предчувствие чего-то…большого, грандиозного или вообще. Вот бывают такие моменты в жизни, когда вокруг тебя что-то происходит без твоего ведома, спроса и участия, и ты вообще в процессе нахрен никому не нужен, и процесс тебя как бы и не касается, но ты его видишь, и офигеваешь от всего этого.
Нечто похожее происходит с «везучими» – которые стоят в самую длииную или самую медленную очередь. И на которых товар заканчивается. Вот отстоял километр, ты следующий, а тут – ррраз! – или вещь тебе нужная закончилась, или в окошечке обед.
Забавная история о театральных постановках
Накануне 1 апреля школьным руководством было решено устроить вечер юмора. От каждого класса требовалось сделать какую-либо сценку, минут на пять. Мы, поленившись писать сценарий, взяли уже готовый текст Жванецкого “Как хоронят в Одессе”. Роли быстро распределили, даже не возникло проблем с оркестром: двое одноклассников занимались в духовом кружке. Следовательно, с траурной мелодией солисты справятся, а в барабан постучать мы как-нибудь сумеем.
Первую репетицию назначили на 6 часов вечера, когда заканчиваются все занятия и “продленки”. Погоняли немного текст и решили основательно заняться музыкальным сопровождением.
Веселые анекдоты
Утро после бурной студенческой вечеринки. На кухне парень доедает остатки закуски. Открывается дверь. Три заспанные девицы.
- Вадик, а что это ты тут ешь в одиночку, почему нас не будишь?!
- Спокойно! Вот салатик доем и буду! Всех по очереди буду!
девушки, студент
Быть одиноким в День Святого Валентина – это то же самое, что быть одиноким остальные 364 дня в году. Не делайте из этого трагедию.
о субъективном восприятии возрастов людей
Марья Гавриловна из “Метели” Пушкина была уже немолода: “Ей шел 20-й год”.
Маме Джульетты на момент событий, описанных в пьесе, было 28 лет.
“Бальзаковский возраст” – 30 лет.
Ивану Сусанину на момент совершения подвига было 32 года (у него была
16-летняя дочь на выданье).
Старухе процентщице из романа Достоевского “Преступление и наказание” было 42 года.
Анне Карениной на момент гибели было 28 лет, Вронскому – 23 года,
старику мужу Анны Карениной – 48 лет (в начале описанных в романе
событий всем на 2 года меньше).
Старикану кардиналу Ришелье на момент описанной в “Трех мушкетерах”
осады крепости Ла-Рошель было 42 года.
Камасутру перевели на латышский
Камасутру перевели на латышский. Получилось опять про оккупацию.
Долго не верила мужу, что спину ему кошка расцарапала… – Пока мне пёс засос на шее не оставил…
Решили с подружками сообразить одну на троих… В результате ни одна из троих не соображала.
А какой термин врачи используют для синдрома “седина в бороду – бес в ребро”? – Предынфарктный кобелизм.
Только русский человек на вопрос «Ты Куда?» отвечает «Щас приду».
Приходили сектанты, говорили что-то о добрых делах. Предложила им вынести мусор – обиделись и ушли…
Жена с чёрным поясом по каратэ — это крепкая семья, воспитанные дети, вежливая свекровь, любящий и верный муж.
Анекдоты понедельника
Девушки очень невнимательно читают сказку”Золушка”. Они дочитывают только до фразы “Золушка вышла замуж за принца.” И бросают. А дальше написано “КОНЕЦ СКАЗКИ”.
- А он тебе про свои прошлые отношения рассказывал?
- Нет.
- Вот козел! А ты ему?
- Нет.
- Вот умница!
Алкоголь это зло

Алкоголь это зло.
Факт настолько очевидный что прямо удивительно почему люди пьют.
- (0)
Что к чему. Че по чем. И так далее…
Приветствую, господа.
Я есть второй админ данного блога, ник – SciFi. Придумал недавно, во время регистрации на одном из закрытых форумов. На остальных известных форумах (нуллед, ачат, срач, гофак) так же зареган, но малоактивен. Почему? Потому что предпочитаю не пиздеть, а делать. Так вот, являясь соавтором блога, готов рассказать и поделиться своими, в общем-то, ценными наблюдения и некоторыми собственными выводами/суждениями.
Итак, небольшой анонс. Чего я касался и о чем могу рассказать.
1. Саты. Автоматическое генерирование контента + автовариации структуры страниц (контента) – очень важный пункт в свете последних событий (АГС). Как и что расскажу, а так же некоторые программы-генераторы (простые и банальные), выложу.
К вопросу об актуальности мест под фарма-доры. Некоторые размышления
К вопросу об актуальности мест под фарма-доры. Некоторые размышления.
1. Во-первых, как показывает практика, в топе по фарме преимущественно находятся доры которым месяц-два. Плюс все это дело неплохо так слинковано между собой.
2. При пристальном рассмотрении – около 50% процентов доров это лом. Но это не отбразилось в статистике, т.к. это единицные случаи (домен может быть в топе по конкретному ключу, а по остальным отсутствовать, в виду того, что дорвейный деятель не стал заморачиваться с другими). Но нас это пока не интересует. Пока.
Ждать 2 месяца не есть гут. Как будем решать проблемку?
Нам надо прочекать топ на предмет последнего изменения страниц по кею и сравнить результаты с предыдущим чеком (обычная текущая выдача). Совпадения, которые изменились в течении, допустим, недели (либо месяца) и есть претенденты на звания именно «Топ Ресурс Под Фарму» Так можно мониторить свежие бонусные местечки, которые отлично ранжируются. Однако не следует забывать, что здесь так же играют достаточно серьезную роль внешние факторы – количесто и качество бэков. Это уже вопрос другого подхода к анализу топа.
Топ почекал. Скачать результаты в экселе можно здесь. Встречаются там интересные вещи.
Пример с моими комментами можно глянуть здесь.
Господа, для наиболее эффективного их использования стоит прочекать конкуренцию по запросам, оценить так сказать «вес» топа, его «сложность». Найти наиболее легкие НЧ и засрать данные ресурсы по полной программе. Это скорее всего будет успех
Подводя первоначальные итоги, можно накидать некоторый план действий для тех кто работает по фарме.
План у меня получился такой:
1. чекаем ТОП10 (ТОП20) по АОЛ.КОМ – по любым таблеточным ключам, главное чтобы их было достаточное количество. Считаю, что 3-5к хватит для нормальной статистики.
2. чекаем ТОП с добавкой «показывать те странички, которые изменились за неделю (месяц)»
3. сравниваем результаты чека топов. Выделяем домены перспективные домены. Кстати интересный расчет. У меня даже excel зависал.
4. Для топа из п1 чекаем «сложность». Как уже ее высчитывать дело каждого
5. На этом этапе мы уже имеем актуальные ресурсы и «легкие» ключи, остается только автоматизировать постинг и расстановку ссылкок.
Есть только одно НО. Таким способом мы найдем только те ресы, которые уже юзаются дорвейщиками. А чтобы быть первым на девственном ресе надо применять другой подход к поиску. В общем то он очевиден, камрады. Для него не надо никаких чекалок. Только руки и голова.
Вот такие вот дела. Поправьте, где неправ.
P/s товарищ Che стукнись в аську, дело есть
- (0)
Двигаем доры в топ. Часть вторая.
Всем привет, это опять я, Чайка.
Сегодня я продолжаю цикл статей «Двигаем доры в топ» и хочу вам напомнить, что это не является пособием, следую которому можно продвинуть конкретный дор в топ, или же создать алгоритм, в соответствии с которым, все ваши доры, опять таки попадут в топ. Это всего лишь обсуждение факторов влияния ранжирование, и мысли как это применить к дорам.
Советую перечитать первую статью этого цикла, т.к. речь опять таки пойдет о контенте, и лучше бы было освежить воспоминания… Кстати, в комментах завязалось небольшой обсуждение с любителем мягких французских каптч, в ходе которого пришлось объяснить ему более детально, всю суть метода. Но человек так и не понял, что это лишь один из методов воздействия, и есть еще и другие. Ну, а после утверждения что для яндекса ниши «знакомства» и «проститутки» – это одно и то же, всякое желание что-то доказать ему пропало.
И так, вернемся к нашим баранам. Недавно почитал на серче тему о продаже генерируемого контента, и подумал, что неплохо было бы изложить мысли по поводу того, что в контенте хорошо влияет на ранжирование, а что плохо…
- (0)
Саты. Версия 1.0
Приветствую.
Отойдем сегодня от фармы и бесконечного клепания профилей/блогов. Немного поговорим о сатах.
Конечная цель наших изысканий – запихивание в индекс Яндекса/Гула кучи страничек с последующей монетизацией этого «многообразия». Да, не попасть под АГС, тоже было бы неплохо. =) А может, еще и траф нам не помешает? Конечно!
Яндекс, привередливая скотина, разборчивая и капризная ПС, которая не любит генерированного текста, кучи однотипных страниц, заспамленности их ключами. Т.е. всего того, что ценит в ГС и дорах большой Г, как называют гугл буржуи. Релевантность текста остальному контенту страницы (да, да, страница, оптимизированная под ключ «видео о чем то там» не будет воспринята Яндексом адекватно, если этого самого видео там не будет) так же остается фактором, который стоит учитывать всегда. Обилие копипаста на страничках – спорный вопрос: с одной стороны это вполне обычная практика для всех СДЛ, с другой такие страницы всегда нужно разбавлять чем-то своим. Например, фото и видео галереями – подборками страничек с картинками и видео (опять же не забываем про релевантность картинок и текста). Кстати, никто не пробовал юзать контент, выдаваемый генераторами стихов (есть у меня подозрение, что его юзает товарищ Шевчук в своем творчестве)? Я вот не пробовал. В качестве разбавки копипаста, думаю сойдет, но без фанатизма. Странички со труктурой варезника, где пишут совершенно не нужные характеристики файла итд – вполне сойдет для разнообразия структуры страничек. В идеале, сат должен использовать разные наборы шаблонов для разных структур страниц. Очень будет здорово, если сат будет обновляться каждый день/через день. Это ценится всеми ПС без исключения.
Перейдем к организации самого сата.
Самое первое, что нам понадобиться это, конечно, набор ключей, под которые мы будет создавать странички. Второе – исходный материал из которого будут собираться странички. Тут уже надо продумавывать какого рода сат будем делать, на что похожим итд. Важный пункт. Вариантов масса. Не бойтесь пробовать. Обретете бесценный опыт. Третий пункт это набор шаблонов (в идеале 1 категория = 1 структура контента страницы = 1 html шаблон страницы, помните? т.е. для всех страниц, заточеных под ключ вида «что-то-тут видео что-там» – юзаем, например, вставку с ютуба, плюс спарсенные комментарии «юзеров», в виде текста, плюс что то еще и еще – думайте, пробуйте). Тут тоже есть тонкость: страницы не должны быть сгенерированными «раз и навсегда». Периодически они должны обновляться новым контентом – типа комментарии и все остальное (в зависимости от выбранной структуры паги). Четвертый пункт это механизм обновлений. Т.к. сат у нас не должен требовать нашего вмешательства на всем протяжении своей жизни, этот пункт очень важный.
Итак, как будет функционировать наш сат.
Жизненный цикл нашей забавной поделки начинается с «рождения» движка. Специальная прога-герератор видоизменяет заготовку уже написаного двига, а именно изменяет названия файлов, ЧПУ, имена переменных в урлах (если они там вообще должны быть – зависит от особенностей двига). Производится первоначальное наполнение сата и прописывание конфига для его дальнейшего функционирования. Тут строятся, например, по 10 страничек в каждой из категорий, вибираются вероятности «обновлений» страничек и обнов самого сата. Поясню: сат будет обновляться не постером, не по крону и вообще без всякого нашего вмешательства. Будет работать система динамического дора (в исходном понимании этого явления, когда дор растет «на глазах», странички создаются на лету, при обращении к ним поискового робота). Так вот на этапе видоизменения двига, прописываются вероятности (ну и ограничения тут же, дабы не было не странице по 500 ссылок на внутряки) появления на старой, известной ПС, странице ссылок на новые странички, которых еще не существует. Тогда при обращении робота к известной ему странице, двиг выдаст на ней новую ссылку при переходе по которой соберется новая страница, либо комментарий, либо еще какое видоизменение контента. Естественно, все эти манипуляции должны кэшироваться и запоминаться. Это важно. Думаю, не стоит говорить, что за каждую категорию сата отвечают свои сборщики страниц, которые реализуют все необходимые нюансы для данной структурной категории. Остается разработать систему хранения контента и всех изменений состояния сата, тут подумайте сами…
И да, – всегда оставляйте возможность добавлять юзеру свои контент – комментарии, статьи, файлы, да все что угодно! Дело в том, что качественный сат может со временем вырасти в полноценный СДЛ. Конечно, надо все это дело модерировать иногда. На деле это не самая простая часть сата. Но, всегда надо ориентироваться на перспективу. И системку надо продумать, надо.
Во избежание АГС.
1. Разная структура контента (пихайте таблицы, дивы, слои, изменяйте css, шрифты и остальное)
2. Разные ЧПУ
3. Разные шаблоны страниц
4. Текст, картинки, видео, остальной контент должны быть взаимно релевантными. Тут Яшку наебать сложно. Да и не стоит на самом деле. Ведь сат это не дор – нам далеко не насрать на срок его жизни.
5. Юзайте качественный исходный материал. Юнипарс вам в помощь.
6. Добавьте сами…
Трафик. Очень положительно сказывается на конечном денежном выражении всех наших творческих потуг. Продвигайте, думайте, больше ДЕЛАЙТЕ.
Есть над чем поразмышлять. Успехов.
- (0)
Вытягиваем из гугла линки ресурсов на экзотических языках или language-pack для hrefer’а
Т.к. в сети существует не только англоговорящие юзеры, но и немножко других =), задумался как бы достать ресурсы созданные на их родном языке.
Собственно решение оказалось, как всегда, простым. У нас ведь есть переводчик гугла с его хорошим набором языков. Беда только в том, что символы то там – сплошной юникод да и только. Возмите, например, японский или китайский, а может есть любители арабского? А ведь арабский сегмент нета – наиболее стремительно развивающийся.
Так вот, хрефер создан таким образом что при парсинге он не юзает такую функцию как URLENCODE, дабы перевести все символы из «ероглифов» в понятный формат для ПС. И о такой вещи как кодировка юникод он тоже почему то не слышал. Так что пришлось немного помочь программе И да, содержание словаря: 1к существительных, 1к прилагательных, 1к глаголов – топовые по частоте употребления в русском языке.
В общем, результатом проделанной работы является полностью готовый к использованию набор словарей для hrefer’а на таких языках:
- китайский
- японский
- корейский
- испанский
- французский
- немецкий
- португальский
- арабский
- итальянский
+ микс-словарь из всех словарей, отфльтрованный на дубли
т.е. 9 самых распространенных языков в онлайне. Скачать можно тута. Расширяйте свои базы, камрады. Приятного парсинга
ps если нужны какие-то еще нативные словари для парсинга – пишите, постораюсь сделать
- (0)
О валентностях, актантах, предикатах и грамматической основе в составе предложения
Куда-то проебался предыдущий пост о семантическом парсере Тузова (с одной интересной книжкой) и приветом VitVVS. Видать, хостер накосячил. Ну и х*й с ним.
Сегодня речь пойдет о синтаксических связях в предложении.
Итак, чтобы собрать не бредоподобное (естественное) предложение надо определить синтаксические связи между семантическими категориями слов. Вдумайтесь.:) Это действительно важно, для тех, кто хочет генерить естественные тексты.
Современная русс.лингвистика говорит, что у большинства слов есть валентность – способность присоединять другие слова. О ней вы можете почитать где угодно. Написано достаточно, хоть и не так много, как хотелось бы. Кто то даже составлял специальные комбинаторные словари, где указаны все возможные комбинации слов РЯ. Но, на самом деле, жизни не хватить охватить весь объем комбинаций лемм. Потому, нужен другой подход.
Считаю, что другой подход заключается в выявлении набора связей между семантическим категориями. Т.е. задания правил о том какие категории могут выступать в качестве актантов (субъекты и объекты) для других.
Простой пример – глагол «писать», простейшая возможность для построения предикатного отношения – это дествительный залог глагола и существительное из семант. категории «Человек», например, «Ученик». Получаем грамматическую основу простейшего предложения – «Ученик пишет», другой пример – «Учитель учит» итд. Здесь существительное «учитель» является первым актантом и заполняет первую валентность глагола «учит». Однако, большинство глаголов имеет от 2 до 4 валентностей (часто на разные падежи). В таких случаях нам нужен уже страдательный залог для глагола, ситуация в которой присутствует не только субъект, но и объект действия. Например «Вася учит стих.»
Вышеописаное – простейшие варианты построения синтаксической структуры единицы текста. Всего же наш любимый яшка при пристальном анализе текста выделяет около 60 разных синтаксических связей. Пруф не покажу. Но он есть.
Моя же основная задача на данный момент – сосвтавить простейшие правила синтеза простейших предложений. Дальше – больше и глубже.
Хэв фан. Продолжение слудует.
з.ы. SEOблог превращается в техноблог, млять
UPDATE
первые нефильтрованные результаты
слева структура предложения на XML, справа – резал генерации по лимиту 10-словной выборки вариантов из базы. уменьшил базу до 5к лемм – все равно покрытие текста остается ~82%. А ресурсы здорово экономит.
Умаялся бля. Дальше все намного проще пойдет. имхо.
- (0)
Продолжаем смотреть топ по фарме
Господа, есть много сервисов предосталяющих поддомен при реге. Это не фрихостинги, это блоги/социалки итд. Так вот, в топе иногда мелькают обычные доры по фарме на поддоменах таких ресов. Поддомен представляет собой фарма ВЧ или СЧ. Точное вхождение или нет.. По разному бывает. Это есть очень положительный момент при ранжировании. Юзаем.
Далее. Клепая профиля/постя в блоги уже на протяжении 2 недель столкнулся с такой фишкой – по НЧ мои поделки бывают в топе уже на второй день после создания (а вот живых из них крайне мало, модеры не спят). И совершенно на неизвестных топу доменах. Это говорит о том, что создавая много много профилей/постов на похер каких ресах есть довольно высокий шанс влететь в топ по удачному стечению обстоятельств. Я имею в виду особенности ранжирования гугла, когда бывает так что он ставит в топ совершенно левый домен/страницу, которой в топе вобщем-то делать нечего. Ибо не доросла еще. Тем не менее факт остается фактом. Юзаем.
Бытует мнение, что для вывода доров в фарма топ нужна хорошая база для спамилки. Хрумера или апостера. Без сомнения, хорошая база – это замечательно. Однако, как показывают умельцы из топа, совсем не обязательное условие. Можно обойтись обширной сеткой профилей, которая подымает «сама себя». Множество доров на разных ресурсах ссылаются друг на друга по анкорам из тайтла. Конечно, для увеличения эффективности такую сеть надо проспамливать, но уже без фанатизма. Юзаем.
Ручной промсмотр выдачи дает гораздо больше пищи для размышлений, нежели автоматизированный сбор инфы, которым я частенько грешу. Мои последние выводы тут такие: для топа подходит любой более-менее вменяемый рес. Не бойтесь экспериментировать, работайте и топ будет Тут есть одно маааленькое условие – всегда ищите ресы которые, позволяют создать странички с вашими кеями в тайтле/урле – это важно. Но и остальными не гнушайтесь, как часть сетки (ссылки с оооочень тематических страниц – результатов вашего труда) – вполне даже сойдут.
Вообще, наблюдений гораздо больше – но пока на стадии проверки.
Все. Пис, бразы.
- (0)
Состояние потока. Зачем и как?
Здоров комрады. Звиняйте, что так давно не писал, но… я даже не знаю что сказать в оправдание. Попробовал себя чуточку в бурже, и решил пока не покидать любимый рунетик… Сложного в бурже ничего не обнаружил, но… душа как-то не лежит. Ну, а по поводу Яндекса и писать то нечего толком – многие на него уже забили, те кто не забили – спокойно делают себе дорчики, ну, а те кто не решился – пофик как-то… Не собираюсь я кого-то агитировать к работе, у человека есть своя голова, и, между прочим, этот человек может с моей же подачи стать мне конкурентом…
Ладно, заболтался я… Раз о работе и писать то толком нечего, я решил придумать кое-что новенькое, не удивляйтесь, это опять пост о психологии работы. Никаких тем, никакой конкретики относительно работы, речь пойдет сугубо об отношении к работе как таковой. Дальше будет много разглагольствований и советов по сабжу, если не интересно – не мучайте свою голову – закройте сейчас.
- (0)
Moder-Ne-Spi-Suka! – простая программулька для многопоточного автокомментирования постов livejournal.com
Возможности:
- многопоточное комментирование записей ЖЖ с ваших аккаунтов
- распознавание ответов ЖЖ (их там несколько вариантов, типа «успешно запощено», «сервис затупил и коммент проебался», «юзер запретил комменты» итд.)
- поддержка прокси (только соксы5), очень рекоммендую юзать, без прокси ваши журналы будут шустро суспендить
- отчеты по проделанной работе
Как работать: в поле линк вписать продвигаемый линк, в файл ank.txt положить анкоры для линка – от туда будет браться случайный. Коммент представляет обычную собой гиперссылку. Свои акки (с которых подет коммент) ложить в email_list.txt в формате user:pass. Прога берет случайный акк, логнится и постит коммент. Плюс в том, что ЖЖ попрежнему разрешает работать с одного акка в несколько потоков. Каптча, если она появляется (частое явление при интенсивном юзании 1 акка), просто игнориться. В файл lj-yand.txt кинуть сылок на посты юзеров (типа http://dreaddy-gyal.livejournal.com/43957.html). Вот и все.
По тестам показало следущее:
на новый год примерно я откомментил 70к постов со 100 акков без прокси. 10к ушло в успешные – т.е. юзер комментируемого журнала разрешил комменты без премодерации. Сейчас все 100 акков засуспендены и комменты от них естественно потерлись самим LJ. По трафу ничего сказать не могу, не замерял, по ссылкам – яшка сейчас видит остатки из 176 шт. Так что не тупим – юзаем прокси и в таком количестве не комментим. По чуть чуть. Однако, минздрав предупреждает: бездумное использование проги ведет к изменению и усложнению процесса отправки комментов сервисом LJ и, как следствие, к потере работоспособности данного билда. А нового, мб, и не будет.
И вообще всегда советую думать прежде чем что то делать.
Скачать автокомментер ЖЖ
Всех благ.
- (0)
Обновление парсера
Добавлено:
- DupKiller – оставляет только по 1 файлу 1 размера в папке, т.е. удаляет дубли
- массовый конвертер из utf в ansi
- простой коструктор урлов (как показывает практика, сложнее и не надо) – «подставлятор» в урл счетчика
- вставлялка картинок в спарсенные статьи (если кому то надо, то опишу подробнее всю технику вставки). Юзал для своих сатов, работает с некоторыми нюансами
- картиночный фильтр (для удаления «битых» картинок), находится на вкладке «Фильтр»
- сохранение странички с расширением .html при тесте селективного парсинга, теперь сразу можно открыть ее в браузере
Исправлено:
- баг с парсингом картинок, теперь парсит нормально (протестировано на google images, спарсил около 2к картинок), но размер картинки должен быть больше 400кб, большего размера не скачивает, ибо нех
- баг с использованием прокси, раньше если прокси оказывался мертвым и коннекта не было парсер считал, что страница спарсена, теперь такие урлы отправляются обратно в очередь на парсинг
Пожелания, как обычно – welcome!
Скачать бесплатный парсер (версия от 06.01.11)
Всех с НГ и рождеством, бразы!
- (0)
Массовый чекер бэклинков по yahoo!
Приветствую.
Не так давно появилась необходимость прочекать массово довольно-таки большой объем сайтов на бэклинки по яху. Из существующих решений не нашел ничего внятного. Какие-то кустарные методы и способы. Например, зачем использовать парсинг ссылок со страниц siteexplorer (и так на протяжении 10 страниц), если можно заюзать ссылку на скачку первых 1к результатов в формате TSV сразу же с первой страницы? Это быстрее в разы и банят не так быстро…
Многопоточности в такого рода программах я также нигде не нашел (а там, где многопоточность – там и прокси по-любому нужны). Пришлось писать самому
Вот что из этого получилось: скачать программу для массовой проверки ссылок по Яху (Yahoo!)
Как с ней работать:
если вам надо прочекать много сайтов на бэки, то для этого понадобятся прокси, где их брать – это уже ваша забота (сайтов с бесплатным доступом, на самом деле хватает – найти не так сложно). Программа работает только с HTTP-проксями, так что будьте внимательны, socks-прокси не подойдут. Собираете список проксей в обычном формате PROXY_IP:PROXY_PORT (например, 123.123.123.123:80), кладете в файл proxy.txt в папке с программой, одна строка – один прокси. Далее в файл sites.txt кладете список сайтов (без «http://»), которые нужно чекнуть. Особенность одна – домены с «www» и без «www» – это, обычно, разные домены, так что сами решайте, что вам нужно чекнуть. Далее запускаете программку, выбираете использовать или нет прокси (если сайтов для чека мало – прокси можно не юзать), объединять или нет результаты проверки в один файл по окончании, выставляете нужное количество потоков и вперед! Результаты парсинга отображаются в т.н. «мониторе потоков».
Результаты чека будут складываться в папку results в виде sitename___links_threadid.txt, threadid – это номер потока (а не количество распарсенных ссылок), сделано в целях избежания ошибок при попадании в список дубликатов сайтов.
Вопросы есть? Или нужны еще какие-то специфические программы? Тогда, го в камменты
- (0)
Никаких итогов и никаких тенденций
Все меняется со временем! Люди меняются чаще всего. Что-то приходит, что-то уходит, появляется новый опыт и пересматривается отношение ко многим вещам…
Это все к тому, что с накоплением знаний и умений, много становится весьма очевидным и понятным. К примеру, когда я только начинал что-то зарабатывать в Инете, такие понятия как «тематические сетки сайтов», «внутренняя перелинковка», «статический вес страницы» и некоторые другие, считал за малопонятные и потому не пригодные к применению приколы. Тогда я только начинал делать саты под сапу (на сканированном контенте, вручную наполняемые блоги на WP)… Яндекс тогда был довольно терпимым существом и с радостью их жрал и держал в индексе. Потом были доры, много экспериментов и опять закономерный успех. Параллельно продолжал сатостроение. Тогда я уже знал, что сканировать контент (или качать и распознавать разные книжки) для сатов совсем необязательно. Можно делать саты на автомате в виде разного рода структурированных объявлений или новостей. Потом был АГС, который выкосил все что было «нажито непосильным трудом», смены алгоритмов ранжирования и много другое. Некоторое время источником доходов были только доры. Потом добавил в ежедневное расписание работу с социалками… Саты под сапу тогда уже не делал. Это казалось унылым говном, не сравнимым по доходам с доров. На самом деле так оно и есть. Мнение не поменялось и по сей день. Делать саты под продажу ссылок – бред, ГОРАЗДО выгоднее этими сатами продвигать свои проекты под трафик.
Однако, дни отменного конверта стали наступать все реже и реже. Нововведения от МТС круто коснулись заработков, основанных на разводе и наебалове. Не спорю траф конвертится, смски идут, но доход от этого постепенно затухает.
В поисках новых источников трафа, пошел в гугл. Это оказалось просто мегаклевым местом для доро-клепания! Трафа хватало на всех, доры банились по расписанию, гугл не капризничал, как яшка (к слову, и сейчас все так же). Жизненный цикл дора здесь был предсказуем на 99%. Доров клепал много – все индексилось и давало траф, все было хорошо.
Механическая работа: зарегил акк/домен, сгенерил дор, залил, проспамил. Повторил с начала от 10 до скольки угодно раз. Не нравится только одно – дор рано или поздно все равно умирает. А с масштабами больше чем 500 доров в сутки – это просто расточительство ресурсов (но раньше я так не думал, теперь задумался).
Так что с сегодняшнего дня начинаю строить те самые «тематические сетки сатов» для выведения серых/белых проектов (благо опыта достаточно для поточного производства). Доры не забрасываю – ни в коем случае, такой источник бабла глупо игнорить. Просто время-затраты теперь будут делиться на 2 части: доры и сетки сатов. Но планирую со временем окончательно уйти от спама и доров.
Такие дела. О сетках, перелинковке, монетизации и прочих сопутствующих вопросах в конкретных шагах – в следующем посте.
зы экономьте время. Это ресурс, который нельзя восполнить.
- (0)
О генерации текста, его качестве, базах данных статистики и прочем всяком сопутствующем
В настоящее время алгоритмы выявления бредотекста у ПС Яндекс развиты в гораздо большей степени, чем у Гугла. Яндекс довольно шустро определяет неестественные тексты, созданные по примитивным алгоритмам такими же примитивными программами-генераторами. А нормальный беспалевный генератор так еще никто и не написал… Хотя многие кричат, что дескать есть у меня мегагенератор, который выдает читаемые тексты – это все мелочи и не достойно внимания. Потому что те, у кого он есть (а вдруг?) просто молчат.
В последнюю неделю опять вернулся к данной теме. Вдруг вспомнил, что нормального текстгена я так и не написал. Хотя попыток было множество. А ввиду того, что давно уже не не программил, решил вернуться к этому увлекательному занятию. Дня четыре уже тестирую разные алгоритмы и подходы. Пока рано говорить о каких-то положительных результатах, но положительные тенденции, определенно, вырисовываются.
Как обычно столкнулся с проблемами производительности, ибо чтобы хранить всякую статистику (какой на данный момент оперирую) хотя бы по 20 метрам исходного человеческого текста, обработанного майстемом требуется 230 метров в виде плэйн-текста или 600 (!!!) метров (примерно 4 миллиона записей в двух таблицах суммарно) в формате БД MS Access 2003. Ладно еще просто хранить, так ведь надо и кое-какие манипуляции производить с этим объемом – поиск, выборки, сравнения итд. Работа сборщика-построителя предложений совершенно не ускорилась при переводе его механизма на работу с БД. А по моему субъективному мнению, еще и замедлилась. И пох на все индексированные поля для ускорения выборок и все остальное. Т.е. никакого прироста производительности. Вот и думай тут…
Опять решил вернуться к простым текстовым спискам внутри программы, а искать по ним нужные данные в несколько десятков потоков – хотя еще эту часть не переделал и про эффективность сказать пока не могу. Теоритечески при нормальном процессоре скорость должна возрасти. Проверю уже на днях.
Сам алгоритм, как сейчас уже понимаю, получается очень ресурсозатратным – чтобы построить одно правильное человеческое предложение уходит от 1 до 10 минут, взависимости от сложности самого предложения и объема словаря статистики. Предложение получается более-менее, но есть над чем работать. Лучшие результаты – на коротких предложениях, где по минимуму всяких повторяющихся частей речи. Тут самое время изучать возможности, которые дают распределенные вычисления, но к сожалению, не имею на то ни времени, ни лишних компьютеров.
Что могу сказать – в этот раз, видимо, доведу все до конца Если комп не загнется от генерации одной статьи за всю ночь. Мда. Думать и думать.
Хотелось бы найти того, кто занимается тем же. Обменяться опытом, так сказать.
Всего хорошего. Продолжение следует…
- (0)
Массово собираем удаленные аккаунты ЖЖ
Приветствую.
Страсть к халяве не исстребима в русском человеке.
Слоняясь по сети в поисках чего бы замутить, в который раз наткнулся на упоминание о бирже buypost, которая принимает только тицевые/пиаристые бложики. А где их взять? Ну, как вариант, заюзать удаленные ЖЖ с ТИЦ, конечно. Хоть и придется все же заплатить самому ЖЖ за восстановление аккаунта. К слову сказать, восстанавливается не аккаунт, а только его имя. Т.е. вам нужно зарегать сначала любой новый ЖЖ и уже только потом использовать возможность переименования своего ЖЖ в ЖЖ с ТИЦ. Что касается наполнения, то тут уж думайте сами чем его наполнить. Я же склоняюсь к дешевым статьям, которых на любой из бирж хватает.
Для упрощения поиска таких ЖЖ написал простенькую программку. Работать с ней проще простого: в файл email_list.txt положить список аккаунтов от ЖЖ в обычном формате user:pass, в файл proxy.txt – прокси, если нужно. Как показала практика прокси не нужны, но механизм уже был сделан, убирать не стал – прога может работать как с проксями так и без. И пока тестил программку, наткунулся на одну особенность ЖЖ – можно логниться сразу в несколько потоков с одного аккаунта. Скорость сбора возрастает в разы. За минуту в пять потоков с одного аккаунта я собрал примерно 45к удаленных акков. Это вам не 500 штук, которые можно вытащить вручную за один раз. Чтобы задействовать эту фишку – скопируйте несколько раз ваш акк в email_list.txt и поставьте соответствующее число потоков, но не жадничайте – не стоит собирать акки в 100 потоков, IMHO прикроют это дело, скорее всего.
По быстрому отчекав их на ТИЦ получил такие резалты:
ТИЦ 10 – 28 шт
ТИЦ 20 – 2 шт
ТИЦ 30 – 1 шт
Вывод тут простой – кто то уже во всю собирает акки с высоким тиц, раз их нет среди свободных. Хоть и выборка относительно небольшая. Так что успевайте и вы, други.
Да, после сбора все собранные акки будут лежать в папке parse в нескольких файлах, их, как вы догадались, надо объединить в один файл и удалить дубли. Тиц чекал своей другой прогой, которая тоже лежит тут же на блоге.
Сборщик качать тут.
Удачной ловли и до скорого.
- (0)
Доры. Мини исследование: сколько $ может принести один домен?
Стало интересно. Решил провести мини-эксперимент. Зарегал какой-то дроп-зеркало, там типа PR5 есть. Конечно, ПР относится не к зеркалу, а к основному домену, но с такими дропами я еще не работал, – мб че и выйдет.
Суть эксперимента – повесить на домен поддоменов общим объемом на 3 гига (уж сколько влезет – есть малоиспользуемый акк у хостера). По предварительным оценкам это 100-250 доров по моим шаблонам. Работать будем с гуглом, т.к. яндекс такие вещи обычно отказывается индексить. Тематика – прыщи. Счетчик трафа будет групповой на все доры сразу. Сливаться траф будет на конвеер.ком. Доры по 1200-1500 страниц, не слинкованы. Что касается продвижения, то тут все банально – «реклама» хрумером. А что из этого выйдет – станет ясно уже через пару недель.
Пока писал заметку, решил сделать еще штучки 3 таких же. Но по другим тематикам.
Результаты буду писать в комментах к посту каждую неделю.
Have fun!
ps походу, возврат к дорам неизбежен – ситуация не очень оптимистичная складывается. Все бы ничего, но вот незадача – понадобилось немножко денег. Возвращаюсь на проторенную тропку.
- (0)
Двигаем доры в топ. Часть первая
Всем привет.
Сегодня я решил не писать о генерируемом контенте, т.к. судя по всему большинство ожидало не каких-то основ, законов и хитростей данной темы, а что-то типа «Вот генератор, умеет то, сё и это».
Все же, хоть контент и интересует многих, но начать стоит с чего-то более простого и быстрого для реализации, и в тоже время что может дать практическую пользу.
Как вы могли понять из заголовка, речь пойдет об особенностях ранжирования, и загнать доры в топ10, а не в топ100. Хотя правильнее было бы сказать, какие доры надо делать, что бы они заняли хорошие позиции…
- (0)
Методы ускорения индексации которыми я пользуюсь в повседневной деятельности
Небольшой обзор методов ускорения индексации доров.
1. Аддурилка – добавляем просто 1-2 страницы, либо используем специальные сервисы/программы, в гугле не работает: политика гугла – приоритет сайтам с бэками, если на сайт никто не ссылается, значит сайт УГ и индексировать его нах не надо.
2. Пинг – пингуем просто 1-2 страницы, либо используем специальные сервисы/программы, в гугле нормально работает (по сранения с аддурилкой), в яндексе с тормозами, ибо яндекс есть Российская ПС, со всеми вытекающими.
3. Закладки – в настоящее время программы для промышленных масштабов добавления страниц в закладки мне не известны. Жукладочник ПРО (который с аникаптчей), SSS – без антикаптчи, и другой хлам. При правильном подходе (например постить сразу в 100 аккаунтов) хорошо работает. К яшке относится слабо, в виду его тормознутости, но все таки лучше чем ничего.
4. Постинг в бесплатные сервисы блогов (опционально кросс-постинг, либо сабмит по каталогам статей – но тут свои тонкости) – для гугла работает отлично, т.к. подобные сервисы имеют хороший вес (траст) в глазах гугла. Что мы делаем: мешаем текст и ссылки на доры и постим в 10-20-30 блогов. Некоторое время назад многими под это дело юзался ЖЖ, до массовой его зачистки от УГ… Но кто ищет – тот всегда найдет! Подобных сервисов – ж*пой жуй на самом деле. Плюс есть специальные кросс-постеры, которые позволяют постить централизовано сразу в несколько разных ресурсов.
5. Трастовые фрихосты (мб, бонусники, но их уже давным-давно не встречал) – для гугла работает отлично. Что делаем: регаем домен (который 3-го уровня) и размещаем там карту дора/мешанку из ссылок и текста. По возможности спамим это дело. В яндексе работает слабо и почти не ощущается, т.к. Яндекс сами знаете что.
6. Профиля блогов/форумов/сообществ – для гугла работает отлично. Что делаем: Ищем хороший форум/сообщество/любой сайт, позволяющий оставлять ссылки и размещаем там карту дора/мешанку из ссылок и текста. Спамим это дело. Так, например, ссылка с профиля bing.com индексируется за считанные минуты. В яндексе не работает (положительных результатов я не наблюдал).
7. Конечно же его величество СПАМ. Тупой и умный, осторожный и наглый. И еще всякий разный… Спамить можно не только хрумером и апостером, можно руками получать отличные результаты. Мои доры проспамленные руками и имеющие всего 10-15 ссылок в гугле дают по 1.5к уников/сутки, в то время как проспамленные хрумом едва дотягивают до 100 уников. Делаем выводы.
8. Набирающий популярность и оживающий (некоторые скажут, что он и не умирал) реф-спам. Ищем соответствующие сайты, отображающие рефереры, пишем/заказываем спамилку и вперед. Результаты индексации замечательные. Опять же не для Яндекса:)
9. Собственная сеть сателлитов – самый хороший способ дать гуглу/яндексу понять, что появились новые доры и их надо проиндексить:) Для разворачивания сети уходит не так много времени – 5к фришек под это дело вполне сгодится. Но если есть свои мало-мальски прокаченные доменчики 2 уровня – совсем замечательно. Пишем скрипт-приемник, ставим его на фришки, пишем специальный постер под наш скрипт, постим текст+ссылки => радуемся скорой индексации. Затраты по времени минимальные. И главное никакого спама.
10. Биржи ссылок. Без комментариев…
11. Лом. Аналогично пункту 10.
12. Спам в коллективные заброшенные/редко посещаемые админом блоги. Такие есть места – заброшеные сайты с открытой регистрацией, где каждый желающий может запостить свою статью. Зачастую такие сайты уже прокаченые/старые и индексация с таких трамплинов отличная. Только вот их меньше и меньше с каждым днем… Сам постил в такие места – сайты на друпале. Ищем.
Доклад закончил.:) До связи.
- (0)
Палим чужие источники трафа
Приветствую, уважаемые.
В последнее время, смотрю много тем о продажах «тем» мелькает серче. Немного заюзав мозг, можно совершенно бесплатно попалить некоторые из них, которые хоть как-то затрагивают зоны видимости поисковиков. И конечно же еще вместе с ними прихватить свеженькую приватную пачечку, но это как повезет. Темы, которые связы с добычей трафа с социальных сетей (и других подобных источников) основанные на «хитрых» манипуляциях вниманием юзера, отстледить, к сожалению, обычно не удается (ну, если у вас хватит терпения, можно завести по паре анкет на многолюдных ресурсах и посмотреть на активность спамеров разного рода в вашем отношении)… Но пищи для размышлений, не сомненно, вам прибавиться.
Итак, находим себе занятие на часок-другой. Собственно не для кого не секрет, что все более-менее успешные партнерки ввиду зверствования мистера Касперского, позволяют припарковать собственный домен. Домен становится почти полной копией самого платника (за редким исключением, особо креативных товарищей), т.е. все надписи, которые представляют собой обычный текст остаются не тронутыми. Этим мы и будет пользоваться: просто копируем кусок текста с платника, идет в гугл и ищем его, не забыв взять в кавычки. Таким образом, мы получаем вполне полный перечень припаркованных к партнерке доменов. Остается проанализировать их бэки, дабы выявить что новое для себя. Бэки можно смотреть как по яху (активки), там и простым поиском в гугле названия домена в кавычках, что то типа «mega-sait.com». В основном оригинальностью они не блещут, однако, иногда встречаются интересности (региональные доски объявлений, городские проталы, просто посещаемые сайты, в которые можно напихать своих ссылок итд – народ там тусуется неопытный, новый для интернета или вообще чисто случано залетевший в поисках чего то экзотического). Ну и конечно, вы получите много бонусов в виде чужых доров, которые также можно проанализировать по бэкам, если что в них понравится (например скорость индексации, новые места для своих ссылок, новая девственная фришка, мб что-то еще).
В догонку: мониторьте иногда сайты фрилансеров на предмет интересных заказов типа новых парсеров, регистраторов, постеров. Некоторые обладающие темами новички влегкую там палятся.
Но не увекайтесь! Гораздо выгоднее работать, чем искать темы/много думать. Проверено. Поверьте, у вас не супер-мега-мозг, способный ежечасно замечать кучу мелочей, что бы в последствии сложить из них новую тему… Обычно все видят части «темы» много-много раз, прежде чем соединить все вместе.
Удачи!
- (0)
Контент. Часть 1-ая или с чем мы борeмся
Всем привет. Дабы каждый раз не представляться, решил создать отдельного пользователя, думаю, так будет удобнее
Сразу же после анонса конкурса, стали появляться комментарии в которых народ требовал интересных записей, а не шанс получить консультацию. Изначально очень стремало, что в друг напишу не то, что интересует общественность, скажем так. Но затем получил несколько комментов касательно вопроса генерации текста, и понял, что данная тема интересует практически всех.
Нелогично было бы пытаться осветить все тонкости данного вопроса в одной статье (пусть даже и большой), и именно поэтому я открываю первый цикл статей на этом блоге – о контенте.
Как вы уже наверное поняли, в этой статье я попытаюсь рассказать, с кем (чем?) мы сражаемся. Понятное дело, что с Яндексом, но давайте углубимся в этот вопрос.
Мы имеем потенциально генерируемый контент, который должен без особых проблем пройти если не все, то первичные проверки Яндекса, что может встать у нас на пути?
Первым делом, это так называемые статистические законы.
1. Закон Зипфа
Закон Зипфа – это закономерность распределения слов в тексте. Если коротко, то это значит что слова «очень», «каждый», «было» встречают в тексте гораздо чаще, чем слова «параллелограмм» или «микробиология». Нелепый пример, но суть ясна. Подробнее читайте по ссылке.
Даже более. На основе этой закономерности, Яндекс довольно легко сможет определить тематику вашего сайта, т.к. они имеет весьма обширную базу текстов различной тематики для анализа, и сопоставить результаты проверки вашего текста с эталонами разных тематик не так уж и сложно.
Вывод:
Стоит себе уяснить, что для генераторов, пишущих текст с нуля, полный рандом не покатит. А вот для специфических алгоритмов перемешивания – вполне.
2. Частотность словосочетаний или Закон Зипфа второго порядка.
Законом Зипфа второго порядка такую закономерность вряд ли кто называет, но назвать это как-то надо было. И так, в чем суть. Для анализа вашего текста, Яндекс использует все те же эталоны, но проверяет не отдельно взятые слова, а словосочетания. Рассмотрим данную закономерность на примере слова «красивый».
В одном из эталонных текстов это слово встречается, допустим, 17 раз.
4 раза красивым окажется сад – красивый сад
3 раза красивым окажется парень – красивый парень
3 раза красивым будет стол – красивый стол
3 раза красивым будет гол – красивый гол
2 раза красивым будет сервиз – красивый сервиз
и лишь по одному разу будут красивыми пёс и бюст.
Что мы можем получить используя правильно собранную базу с точки зрения закона Зипфа первого порядка и простейшую морфологическую подмену? Если в нашем тексте так же будет это слово встречаться 17 раз, то скорее всего после него будут идти 17 разных слов, причем далеко не самых подходящих, по типу «красивый зуб» и «красивый дебил».
Несмотря на то, что ваш текст выйдет правильный с точки зрения морфологии, он все равно будет отвергнут Яндексом. Стоит отметить, что для получения более точных результатов, проверку стоит производить по гораздо большему кол-ву словосочетаний, нежели отдельно взятых слов, что делает этот процесс более ресурсозатратным. По сему эта проверка производится не над каждым сайтом, а лишь при наличии косвенных причин на то, что ваш сайт (дор) был сгенерирован.
Вывод:
Избежать бана можно следующими способами:
1. При подстановке каждого последующего слова проверять частотность потенциального словосочетания по базе тематического текста. Желательно с лемматизацией.
2. Работать с парами (или более) слов – Либо при генерации с нуля, производить подстановку пар слов, либо при методах уникализации большого исходника брать от 2-ух слов.
3. Избежать данной проверки – т.е. не палиться по другим признакам. Не будет подозрений, не будет проверки.
Пост и так уже вышел слишком большой, что бы сильно не нагружать за один раз, на этом на сегодня все. Скорее всего завтра будет очередной пост на эту тему, ждите. И не забывайте подписываться на RSS ленту (счетчик справа).
По поводу конкурса и консультаций: открыл конкурсные комменты, что бы вы смогли увидеть что никаких подтасовок нет, и сравнить время ваших и выигрышных комментов, все честно
Ники победителей:
1. bablorub (10-ый коммент)
2. Одесский бомж (15-ый коммент)
- (0)
Конкурс. Приз – консультация
Всем привет. Это опять я (chayka). Сегодня с утра пораньше созрела идея сделать небольшой конкурс.
Суть проста. Вы оставляете коммент (желательно к этой записи) в нем указываете свой ник, емайл и пометку что коммент конкурсный.
На блоге стоит пре-модерация комментариев. Подобные комментарии я буду оставлять скрытыми, до определенного момента.
Конкурсные комментарии под порядковыми номерами 1, 5, 15, 25 и 50 являются выигрышными. После появления этих комментов я озвучиваю ники победителей в следующих постах, затем им надо отправить номер своей аськи мне на мыло (chaykonavt###gmail.com, обязательно с того адреса, который вы оставили в комменте)
В качестве приза победители получат консультацию по теме дорвееводства продолжительностью в один час. Кто-то захочет узнать азы, кто-то ответы на конкретные вопросы, кто-то еще че-то, не суть важно.
Пример коммента:
1. chayka
2. chaykonavta###gmail.com
3. Хочу консультацию
Как-то так. Кстати, один победитель у нас уже есть, т.к. чуть раньше я запостил подобный топик на МТ.
Ник – webvs . Жду письма.
P.S. Подписывайтесь на RSS, т.к. дальше победители будут объявляться в новых постах.
- (0)
R-dorgen мини обзор
Буквально несколько дней назад поступило предложение заполучить лицензию сего продукта в обмен на пост обмен, на что я быстро и согласился. Вышла небольшая задержка с постом, т.к. работы на компе было на несколько дней вперед, но хотелось уже если и писать, то какое-то свое мнение по поводу тех или иных функций, а не просто перечень. Я выделил несколько примечательных для себя функций:
1. FTP
Сразу же хотелось бы отметить наличие такой важной функции, как многопоточная заливка через прокси. Не проблема если надо залить доры к себе на сервак\vds или же на какой-то более менее шустрый фрихостинг, но как только речь заходит о медлительных фрихах, на которые один дор льется пол часа – сразу же необходимо искать дополнительный инструмент и менять схему, теперь подобной проблемы нет – этапять.
*так же интересна заливка zip архивами, но еще не пробовал.
2. Контент
Рано или поздно приходится собирать контент для доров, опять таки, до этого мне приходилось использовать множество сторонних программ, но теперь появился ряд удобных инструментов для этого:
- парсер яндекс картинок
- парсер YouTube
- генератор favicon
- парсер wiki
- чистка контента
- парсер гугл-новостей
3. Просто полезные фичи
Помимо плюшек с контентом я нашел для себя еще кое-че в этом доргене, что способно облегчить мне жизнь, а именно:
- массовое добавление доменов в isp (так же есть и в cpanel)
- качественная обработка текстов и ключевиков с использованием морфологии.
- возможность установки отдельного шаблона для главной странице (кто в теме – поймет зачем это )
- генерация страниц без ключевиков
Ну, и пара функций, которые в ближайших планах не собирался использовать, но в дальнейшем можно будет что-то придумать:
- генератор проектов для хрумака
- генерация уникальных шаблонов под гугл.
Естественно, это не полный список функционала, а лишь те функции, которые для меня сейчас важнее всего, ибо весь список большой и вы его можете найти в ридми, или вот тут:
http://rushter.com/2010/r-dorgen-3-x/#more-773
В общем, мне дорген очень нравится, и без тени сомнения я бы его рекомендовал для работы.
Cya
- (0)
Философия, мать ее
Извечный вопрос – СДЛ или ГС. Ответ вы знаете сами…
Так почему же ГС (дор) – наш выбор?
1. Это просто
2. Это быстро
3. Не надо думать
4. Не надо учиться новому
5. Не надо изменяться
6. Иллюзия «я же работаю» – неплохая отмазка, да.
7. «У меня не получится СДЛ»…
8. «Мне чего то не хватает для СДЛ»…
8. Еще тысяча смежных или следственных причин
У нас вроде бы есть мозги, логика и чего там еще, наверное… Однако, сфера их применения несколько узковата.
Как же так? Нежелание меняться и выходить на новый уровень. Почему – это всегда напряги = стресс.
Нет времени? Отмазка, конечно. Гораздо больше его тратим на такие стреммые вещи, что и думать не хочется.
ПОЧЕМУ МЫ ТАКИЕ? Всему виной – странное отношение к себе. Типа себялюбие и жалость к себе. Как мне хуево, как я устал, как все заебало, какие дебилы меня окружают и остальное, сами продолжите.
Вывод один – шлите на хуй все свои отмазки и нелепые размышления, становитесь уже Человеком, наконец.
Ума, терпения, понимания…
Эзотерическая точка зрения: если ты жив – так работай и развивайся, займись делом, наконец. Открой биз, заработай денег, создай новые рабочие места, дай людям надежду (кому то и смысл), дай им то, в чем они нуждаются, организовывай конкурсы и конференции, спонсируй инновации и добрые начинания, заходи все дальше, влияй на социум, измени мир к лучшему! Если не начнешь сейчас, то начнешь завтра, если не завтра, то через год, если не через год, то через 100 лет – все будут повторяться до тех пор, пока, ТЫ не бросишь занимаешься хуйней, которой ты занимаешься на протяжении уже многих жизней…
Есть еще много слов, но хватить.
- (0)
Заливаем доры по ftp через прокси
Вспомнил случайно, что есть такая тулза у меня. Многопоточно заливает файлы через прокси на фтп.
Писал для доров, последний раз пользовался, наверное с год назад – когда деревья были большими. Работает шустро, но требует нормальных socks5 проксей. В то время я юзал прокси от awmproxy.ru. Да и сейчас их рекоммендую. Что касается парсинга яшки через эти прокси – то тут ситуация хреновая. Думаю, всему виной всякие сервисы, которых щас расплодилось много по проверке «сео параметров», бля, в пакетном режиме. А заливать доры – норм.
Прога работает так.
1 поток рекурсивно заливает конкретный дор через конкретную проксю, с сохранением структуры папок. Когда файл залит, то он удаляется. Таким образом, прога заливает в цикле до тех пор, пока в папках доров есть хоть что то. Как только там ничего нету – значит все гут. Кстати, не снимайте галки в проге. Я уже не помню, на что они влияют – хоть и подписаны Но действуют однозначно не так просто.
Прога берет акки из файла accs.txt. Файлы доров должны лежать в папке doors, каждый в своей подпапке.
Формат accs.txt такой (1 строка = 1 акк):
http://site.ru/;ftp.site.ru;user;pass;remote_dir;
site.ru – идентификатор дора в папке doors – в папке под этим именем должны лежать файлы дора
ftp.site.ru – фтп хост
remote_dir – директория на хосте, куда лить. льете в корень – писать /
Вот в общем то и все. Да, заливальщик удаляет файл только тогда, когда получен ответ от сервака, что файл успешно сохранен.
И еще есть нюанс – для заливки по фтп создается 2 сокета, 1 «управляющий» по которому передаются команды (типа принять файл такой то или создать папку), 2 служит только для передачи файлов. Так что будте внимательны – если заливаете, например, в 100 потоков (а я так и заливал – работает стабильно), то на деле у вас 200 соединений. Просто АВМ меня побалил однажды за превышение количества соединений. Просто имейте в виду.
Качать тут.
Доброго залива. Пис.
- (0)
Ну чего? Мож займемся чем интересненьким?
Привет, тебе!
Сегодня немного не про доры Про тиц.
Так как пузомерка ТИЦ сейчас все еще актуальна и ее хочется по больше, а обнаглевший яшка ее все никак не апнет, у многих появляются сомнения по поводу целесообразности спускания бабла на сапе в надежде на скорый ап тиц…
Размышляя о том как минимизировать потери на прокачку нашел 2 относительно «малосъедающих» времени пути.
1. Ссылки со своих сатов – успешно реализовано и фунционирует в данный момент. Да, да – у меня есть своя минисапа. Минус – мало своих сатов в индексе, так как генереные ГС перестал клепать больше года назад, а може даже и двух… Теперь саты исключительно на рерайте и копирайте.
2. Обмен ссылками через какйю-нибудь систему обмена. Да, именно автоматический обмен ссылками с сайтами присутствующими в индексе яшки.
Все что нагуглил это сомнительные полузаброшенные линкаторы, к которым у меня почему то доверия нету. Вот и подумалось, что неплохо бы замутить системку то. Я бы, к примеру, с радостью поменялся бы ссылками со своих сатов с кем-то в индексе яши, само собой на автомате – мне совсем не охота возиться с каждым сатом и ставить в ручную ссылки. И денег не потрачу и Тиц подращу, мб даже продвинусь по ближе к юзеру
Так что система имеет право на существование, ИМХО. Наверное, в скором времени увидит свет.
До новых встреч!
- (0)
Автоматический обмен ссылками
Привет, товарищи!
Доделал сегодня свой обменник. Вроде бы работает, но медленно.
Идея простая – перекресный обмен ссылками с сайтами, которые есть в индексе Яшки. Функционал самый минимальный.
В двух словах, как работает это все дело.
1. Регаетесь. Но комментс.
2. Скачиваете код обменника, устанавливаете на сайт, втыкаете в шаблон код вывода ссылок. На всякий случай, зайдите на сайт и посмотрите нет ли каких ошибок. На папку, где лежит код поставьте права 777 – тут все как в сапе. Папка должна лежать в корне сайта.
3. Добавляете сайт в обменник и ждете, пока он получит страницы сайта из Яшки. Сейчас сервис не сканирует сайты, страницы берутся напрямую из яшки и только первая сотня результатов. Естественно, на УВ тоже разделения нет. Откуда у нищебродов деньги на нормальный сервак? ммм?
4. Дожидаетесь, пока сервис отработает. Все медленно добавляется, каждая страница проверяется на предмет установки кода. А так как на этом же серваке у меня крутится отколо 7к доров, то тормоза есть, конечно. Но ниче, посмотрим сколько народа будет юзать. Перенесем на другой, если че.
5. Удаляете страницы, на которых не хотите размещать ссылки (например, главную).
6. Обязательно добавляете тексты для обмена (ссылки) – то что будет располагаться на сайтах партнеров. Без текстов сайт не может учавствовать в обменах. Да, урлы добавляйте в виде html текста типа [ Мой крутой сайт. ]
7. Тыкаете на exchange и смотрите результаты случайного подбора если устраивает, то жмакаете на подтвердить обмен.
8. Обмены будут предложены овнерам сайтов, если они их пожтверждают – ссылки устанавливаются, обмен фиксируется.
Как то так.
Сейчас в обменнике всего 1 мой сат. Всех приглашаю потестить и обменяться. Все вопросы писать в коммены или в аську.
И вообще, Чайка обещал форум поставить, да только что то куда то пропал. Не судьба, видать.
Всем хорошего настроения!
- (0)
Первые попытки построение связного текста
Если генерировать более-менее удачные (приближенные к естественным) предложения относительно легко, то связать из них хотябы приближенно-человеческие текст – занятие не для слабонервных. Вчера весь день программил разного рода связки между предложениями, тестил… Это совсем не просто, как оказалось.
Рассуждал примерно так:
1. Текст – набор связных предложений.
2. Предложения связаны последовательно.
3. Последовательная связь выражается путем употребления слов (я взял существительные) из предыдущего предложения в последующем. Т.н. «сохранение контекста».
И что же получается? Получается не ахти… Вот простой генеренный пример на 10 предложений, с ограничением длины (от 60 до 100 симв.) в предложении, порядок цепи – 3:
Не зная, как назвать его книгу сложно соглашаться с женщиной…
Женщина боится показаться мужу слабой в родах и эпизиотомии ..
Род породил подобающих различным системам Богов, являющих собой продолжение Рода.
Род Рипсалис семейства кактусовых объединяет около шестидесяти человек.
Человек принадлежит к гетеродонтам, так как зубы мелкие.
Зубы протеза должны гармонично имитировать возрастные особенности зубов пациентов.
Пациент производит маятникообразное покачивание туловищем или ногой – всегда успокаивает Гжелку.
Нога движется пальцами вперед, около самого пола, другая лежит на плече.
Плечом называется многолетняя ветка, отходящая прямо от пляжа.
Пляжи объявляют о начале супер-пупер-мега-гипер конкурса под бодрым пионерским названием Найди 10 отличий.
Как видно, хоть и есть какое-никакое соблюдение контекста – оно очень уж слабо выраженное.
Пример с цепочкой 4го порядка:
В книгу Гиннеса внесен самый крохотный молитвенник высотой в полсантиметра.
Высота стекла аквариума 120 см, материал аквариума – триплекс.
Триплекс остекления – светопрозрачные конструкци с трёхмерным стеклом ЗАО Фиакон.
Стекло является традиционным материалом, используемым в строительстве…
Строительство дач занятие довольно хлопотное, поэтому начинать я рекомендую с Solo.
И все в таком духе. Проблема вычисления контекста последующего предложения налицо. Надо работать дальше.
Кстати альтернативные варианты пстроения текста (предложений) я что то пока совсем забросил… Все чаще приходит мысль о том, что как бы ни был совершенен алгоритм, все равно наполнять СДЛ на таком тексте не станешь. Для сателлита, может и подойдет, однако, не для каждого. Хз, многое еще надо сделать, но боюсь, потребуются большие временные затраты.
ps Дело это ни в коем случае не оставляю, но тратить время в том объеме, как ранее – уже не могу.
pps У кого есть мысли/предложения – велкам!
pps привет саперам. мб, у вас, будет что сказать?
До новых встречь…
- (0)


