Для работы в буржнете, будь то фарма или kinovip нужно где-то парсить англоязычные запросы. Ну не покупать же начинающему дорвейщегу базу Пастухова за 4 сотни невинно убиенных енотов
.
Можно конечно и вручную wordtracker помучить, но все же в двадцать первом веке живем. Поэтому на прошлой неделе озаботился поиском соответствующей софтины либо скрипта. С дармовым софтом мне опять не повезло, ничего из найденного в паблике у меня на компе не заработало, а пятидесяти постов на нулледе не имею.
Так что вновь сам написал себе программку и решил выложить, может, кому тоже пригодится:
Скачать программу для парсинга WordTracker.
Программа написана на скорую руку, поэтому имеет минимум функций, в частности - периодически нужно вручную вводить капчу. Тем не менее, за час вполне реально напарсить несколько тысяч запросов.
Для начала парсинга нужно ввести слева от кнопки “Add” стартовый запрос, например “buy movies”, этой же кнопкой добавить запрос в очередь и нажать кнопку “Start”. Парсинг автоматически ставится на паузу в двух случаях: если wordtracker просит капчу и если по запросу ничего не найдено. В первом случае нужно просто ввести капчу и парсинг продолжится автоматически, во втором - еще раз нажать кнопку “Start”. Программа сохраняет во время работы данные в два текстовых файла “keys.txt” и “keylist.txt”. В файле “keys.txt” записываются найденные запросы и их количество, разделенные точкой с запятой, а в “keylist.txt” - текущая очередь запросов на парсинг, что позволяет при следующем запуске программы продолжить парсинг с места остановки.
ВНИМАНИЕ! - файл “keys.txt” с результатами парсинга перезаписывается при каждом запуске программы, не забывайте копировать сохраненные данные. Так же необходимо, что бы программа была развернута на весь экран, т.к. html-код в нижнем окне разбирается построчно и не должно быть лишних переносов строк, иначе запросы будут распознаны неверно.
Вот в принципе и все, но если все-таки запутаетесь в программе с тремя кнопками - пишите
Ну и напоследок еще небольшой подарок - база англоязычных кеев (где скачал не помню, давно это было
) - в распакованном виде 45 Мб, для начала хватит, дубли вычищены. В базе есть и фарма, и адалт, и много чего еще. А по второй ссылке доступна скачанная еще где-то база англоязычных адалт запросов.
Скачать базу eng-кеев (17 Mb).
Скачать базу adult eng-кеев (700 Kb).


Комментарии