[WT] [Архив] [Поиск] [Главная] [Управление]
[Совместно с IIchan.ru]

[Назад] [Вся нить] [Первые 100 сообщений] [Последние 50 сообщений]
Ответ в нить [Последние 50 сообщений]
Имя
Animapcha image [@] [?]
Тема   (reply to 773)
Сообщение flower
Файл 
Пароль  (для удаления файлов и сообщений)
Параметры   
  • Прежде чем постить, ознакомьтесь с правилами.
  • Поддерживаемые типы файлов: 7Z, BZ, GIF, JPG, MO, MP3, OGG, PDF, PNG, PSD, RAR, SVG, SWF, TXT, XCF, ZIP
  • Максимально допустимый размер файлов: 10000 кБ.
  • Изображения, размер которых превышает 200 на 200 пикселей, будут уменьшены.
  • Ныне 1618 unique user posts. Посмотреть каталог
  • Радио:

Файл: 125161436960.gif-(1.67KB, 68x150, 1.gif)
773 No. 773 watch    
Здравствуй, Ычик!
Появилась идея разработать Gelbooru downloader.
Суть такова - пользователь задаёт теги, по которым хочет искать, кол-во страниц которые нужно выкачать и папку куда качать.
Программа же будет сама искать по этим тегам и скачает пользователю в папку заданное кол-во пикч.
Потом возможно добавление поддержки других сайтов, вроде danbooru и т.д.
В принципе, я вполне могу взяться за разработку, и скорее всего, смогу сделать такую прогу, но вопрос - нужно ли? Анон, тебе нужна такая прога?
467 сообщений пропущено. Показаны 50 последних сообщений Развернуть все изображения
>> No. 4305    
Не плохо бы еще добавить, чтобы грабер и swf фйлы с e621.net сохранял
>> No. 4309    
Файл: 130323701029.jpg-(81.44KB, 1280x720, Sketchbook_full_color_s-1.jpg)
4309
няша. уже два часа пытаюсь вытянуть с девиантарта хоть какой-нибудь лист. Вроде и категория небольшая, но граббер уже за 2000 страниц перевалил. как? ведь уже больше 1000. И вообще несколько раз http 500 выскакивала. Вообще хочу возможность ограничения загружаемых картинок.

Кстати при нажатии на отмену список уже загруженных файло вне сохраняется. это неправильно. почини

у меня все
>> No. 4323    
>>4305
Надо будет релизнуть. Скинь пару страниц с swf'ками.
>>4309
Ты бы ключслова оставил для тестов.
А при отмене списки да, не остаются. Вообще я начинал делать проверку на "догруженность", сохраняя в файле страницу, на какой закончилась загрузка, и сделать возможность догружать с недогруженной. Но функция не очень нужна была, т.к. обычно не составляло проблем получить полный список, и другие проблемы с прогой были, поэтому так и осталось не сделано. Надо будет доделать.
>> No. 4324    
>>4305
лол, уже не надо, просто ключевого слова "swf" достаточно.
>> No. 4393    
Стал загружать только первые 10 страниц на пиксиве. Что не так?
>> No. 4394    
И еще нужна опция автоматической загрузки в нужную папку сразу после загрузки списка файлов. Очень удобно если на ночь запускать.
>> No. 4420    
Сегодня проснулся - загрузка списка остановилась где-то на 7к+ файле. в логе Socket Error (номер не помню). Уже загруженный список не сохраняет, кнопка Grab! не активна. Пичаль.
>> No. 4421    
>>4420
Ах да. PIXIV
>> No. 4443    
>>4393
dono, все работает (pixiv, ключ qb). Может по ключу и нет больше 10 страниц?
>>4420
Закачка пикч или именно загрузка списка? Там же предложение продолжить должно было появиться. А вообще это обычное дело, т.к. пиксив тоже не резиновый и выдает ошибки время от времени.
Про то, что недогруженный список нельзя сохранить, тоже писал. Не предназначена прога для работы с неполными списками.

Извините, куны, но я еще долго не буду ничего доделывать. Как ни возьмусь за что-нибудь, что-то происходит, на что приходится переключать внимание. Так что на данный момент забросил я софтину. По крайней мере, скоро отпуск (должен быть), тогда поглядим.
>> No. 4446    
>>4443
Это стандартный жизненный цикл подобных программ. Посмотри, сколько человек забросили до тебя.
>> No. 4457    
Файл: 130450619080.jpg-(75.42KB, 511x382, scrn.jpg)
4457
>>4446
Ага, в этом я с тобой согласен. Эта программа у меня долго житель. Вообще начал я ее делать еще в начале 2009го, тогда она выглядела пикрелейтед. Лежала почти год, затем за месяц (во время безделья на сессии) я ее привел к текущему виду.
Она мне и такой нравится, и я получил довольно много опыта, ради которого я всем этим занимался. Если бы сейчас я все начал с нуля, я бы начал по другому.
>> No. 4585    
Файл: 130552639392.jpg-(135.08KB, 600x850, 18864856.jpg)
4585
Внезапный бамп. На пиксиве снова поменялась разметка, залил с фиксом.
http://files.mail.ru/TAX6O3
>> No. 4693    
Файл: 130683256540.png-(30.37KB, 517x550, wtf.png)
4693
>>4585
Грабер охуенен! Пиздец, как я раньше мог жить без него!!?
P.S. WTF с девиантом?
>> No. 4703    
Файл: 130709793133.jpg-(5.71KB, 73x73, b4c6d7b33d31ef3a46cd604168687faf.jpg)
4703
>>4585
Простите, как работает переменная "Cnt. filter x"? Что делать после выбора, для применения фильтра?
Хотелось бы отделаться от обнаженки, но не получается. И вариант с логином в аккаунт с сэйф настройками гелбуры кажется невозможен.
Спасибо за граббер!
>> No. 4704    
Файл: 130709829231.jpg-(30.15KB, 344x620, l_717.jpg)
4704
PS.
Кнопка Grab активна только после полного поиска по тегу?
Если да, то как сохранить первые Х пикчей?
>> No. 4708    
ОН ЖЕ ИЗМЕНЯЕТ ХЭШ КАРТИНКИ!
Скачивалка imagegraber модифицирует картинки, которые скачивает с сайтов и добавляет к ним около 150 байт, после чего MD5 хэш картинки меняется. И вы не сможете теперь сопоставить имя и хэш, и не сможете удалить дубли файлов.
И вообще на кой черт лезть в картинку и что-то добавлять, когда от вас ждут, что вы скачаете ОРИГИНАЛЬНУЮ картинку без модификаций и с хэшем, соответствующим имени???
>> No. 4712    
Нашел баг: некоторые картинки вроде как Not Found, но на самом деле они есть, только расширение у них другое.
graber пытается скачать пикчу с расширением .jpg, а на самом деле у нее расширение .jpeg
Например graber говорит что Error 404 для этой ссылки: http://danbooru.donmai.us/data/83ff3f8472906c722cb8e7ae3630c99c.jpg
Но на самом деле нужно просто другое расширение попробовать: http://danbooru.donmai.us/data/83ff3f8472906c722cb8e7ae3630c99c.jpeg
И такая картинка найдется.
Я думаю, что graber просто скачивает странички и в них ищет md5 картинок, а потом подставляет расширение .jpg и если у картинки другое раширение (нестадартное), то graber обламывается потому что сервер не может найти с расширением .jpg
Наверное надо или изменить алгоритм поиска имен картинок или больше расширений подставлять и проверять.
Кстати найти пропущенные картинки можно введя md5 этой картинки - для выше приведенного примера я нашел ее введя в поле Search:
md5:83ff3f8472906c722cb8e7ae3630c99c

ps. мне тоже не нравится что картинки изменяют свой md5 после скачивания. Автор, пожалуйста, сделай чтобы картиники не менялись. Не надо туда записывать адрес сервера и тэг по которому искали картинки. Все это есть в пути, а картинка пусть остается нетронутой!
>> No. 4713    
>>4712
В этом треде еще сотня реализаций качалок, среди которых есть те, которые делают это правильно, а не через зад. Можешь использовать их.
>> No. 4720    
http://dlg.ruanime.org/
>> No. 4721    
>>4720
Шах и мат.
>> No. 4724    
>>4721
Будто приделать вебморду к любой из качалок в этом треде - большая проблема. Хотя, для качалок на шарпе - наверное да. Причем эта вебморда всего-то парсит результат, полученный через апи и приписывает к нему хостнейм, его все равно нужно вставлять в вгет. >>811, например, делает абсолютно то же самое, но ничего копировать и вставлять не нужно. Ну и главное:
>Danbooru link grabber November 21, 2010
>Первая работоспособная качалка в треде 30.08.2009
>> No. 4725    
>>4724
Я человек, которому просто нужно скачать картинки с буры.
Открываю я твою ссылку: Что это такое? Куда тут чего вводить? Где кнопочка "СКОЧАТЬ БЕСПЛАТНО БЕЗ СМС"?
Открываю веб качалку: 2 листбокса, текстбокс для тегов и заветная кнопочка. А список легко кушается давнлоад-менеджером.
>> No. 4734    
>>4713
Большинство линков умерло. Насчет не через зад - посмотри интерфейсы некоторых качалок.
>> No. 4735    
>>4734
>интерфейсы
>работа с апи
Я не знаю, где ты видишь связь.
>> No. 4746    
>>4735
Если интерфейс сделан очень неудобно или так, что разобраться в нем невозможно, то можно говорить что качалка сделана через зад.
>> No. 4747    
>>4746
Если пользователь не может осилить хелп, в котором 3 параметра, то можно говорить, что пользователь - идиот.
>> No. 4751    
>>4693
Подтверждаю ошибку. Посмотрю сегодня, в чем косяк.

>>4703
Для гелбуры не работает логин, ога, до сих пор не было реквестов на фильтр обнаженки. Завтра тогда залью билд с возможностью логина, только не уверен, что он поможет, т.к. чаще всего фильтрованные пикчи отображаются в блоке с параметром hided, а прога и такие вытаскивает. Придумаю что-нибудь на этот счет.
Cnt. filter должен срабатывать сразу (прямо после изменения значения). Он фильтрует тэги по количеству картинок с этим тегом.

>>4704
Только после полного поиска.

>>4708
До сих пор не было ни одного человека, который таким занимался. Завтра залью билд с галочкой "сохранять тэги в jpg") чтобы можно было оставлять исходный хеш.
>> No. 4752    
Изначально graber был задуман как качалка для пиксива и т.п. нестандартных имейжборд (сейчас это еще деварт и е-хентай), т.к. на то время не существовало нормальных качалок для них. Все стандартнобуры были просто как приятное дополнение по реквестам.
>> No. 4753    
>>4751
>Если да, то как сохранить первые Х пикчей?
uncheck->all.
Выделяешь 10 первых элементво списка.
check->selected.
>> No. 4755    
>>4703
Не совсем понял, но может нужно вписать в тегах (-rating:explicit). Без скобок.
>> No. 4756    
Файл: 130764323027.jpg-(50.86KB, 450x536, 1303152629158.jpg)
4756
Поcоны, так я не понял, чем лучше всего с Пиксива качать? Вы мне прямо скажите.
>> No. 4757    
Файл: 130765344774.jpg-(310.22KB, 1093x842, Без-имени-1.jpg)
4757
>>4756
На пиксиве арта побольше, и не только отборный SUPERYOBA, асло все равно почти весь арт тащат оттуда, так что есть возможность получить арт раньше остальных (или схоронить тот, который удолят авторы через пару дней от жадности). А еще там додзbки выкладывают ^_^. У каждого своя фагготрия.
>> No. 4760    
>>4757
Блджад, да я спрашивал, какой программой лучше всего с него тянуть.
>> No. 4762    
>>4760
В этом треде альтернатив graber`у не выкладывалось.
Есть еще нипонская консольная поделка поделка на нипонском же языке, и надо отдельно еще 3 софтины поставить чтобы запустить эту:
http://nandaka.wordpress.com/2010/01/13/pixiv-batch-downloader/
Еще есть плагин для фурифокса, но как оно работает я не проверял:
https://addons.mozilla.org/ru/firefox/addon/ank-pixiv-tool/
>> No. 4763    
Файл: 130770286843.jpg-(369.65KB, 2507x3541, 12198501.jpg)
4763
Перезалил грабер:
http://files.mail.ru/UQ25PT

>>4585
>P.S. WTF с девиантом?
fixed. Рекомендую сначала проверять количество результатов по запросу (из-за ограничения 10к результатов сервером) и качать по категориям.

>>4703
>Хотелось бы отделаться от обнаженки, но не получается.
Лучший вариант:
>-rating:explicit
Можешь записать в saved tags чтобы постоянно заново не прописывать.

>>4708
Добавил отключаемый чекбокс "save meta to JPEG".

>>4712
>graber пытается скачать пикчу с расширением .jpg, а на самом деле у нее расширение .jpeg
fixed.
>> No. 4764    
>>4762
>софтины ставить
>BeautifulSoup
Да а где ты увидел 3? Уж не питон, который есть везде, ты имел в виду.
>> No. 4766    
>>4764
Буры грабят только красноглазики, да.
>> No. 4770    
>4763

А почему такая скорость маленькая? Через шлюз где-то что-то?

У меня 100Mbit/s, скачивает со скоростью 50Kb/s.
>> No. 4771    
>>4747
А если боардюзер пишет про хелп которого в программе нету, то он кретин с рождения
>> No. 4773    
>>4763
Кодер-кун, запили, пожалуйста, поддержку http://ponibooru.413chan.net/
>> No. 4776    
>>4770
Ограничение скачки только сервером и твоим каналом. Попробуй прибавить потоков.
>>4773
OMG, оно существует...
>> No. 4778    
>501 сообщений и 134 изображений пропущено. Для просмотра нажмите «Ответ».
Новый тред >>4777
>> No. 4783    
>>4770
>У меня 100Mbit/s,
Я так понимаю, когда у тебя появится гигабитная сетевуха, ты будешь говорить, что у тебя скорость 1000Мбит/с?
>> No. 4854    
нипроебем
>> No. 4949    
op
>> No. 5489    
Вот задался вопросом как легче парсить с e621
Есть тупая закономерность, страницы с id картинокой. Я к примеру хочу качать не по тегам, а по нескольким страницам, к примеру последние 4-5 страниц.
http://e621.net/post/show/
это id поста с картинкой.
Открывая эту ссылку, в коде есть ссылка на скачивание (Download) картинки вида:
/data///###.&&&
** - директории всегда разные
## - название всегда разное у картинки
&&& - ну и формат картинки/файла
К примеру (если отобразится:
<a href="/data/4a/6a/4a6ab4ea6c90fca67447f588bdd6c9cb.jpg">Download</a>

Помню смотрел как задавать параметры грабберу для DLE9 движка, так надо было вставить начало и конец кода, между которыми надо парсить контент. Может так же сделать?
Я к примеру ввожу диапазон Id'ов для ссылкок на посты с картинками, а программа сама находит нужный код и подставив домен сайта, качает картинку/файл.
Помоему простая схема для написания, но увы я не програмист и не понимаю как это реализовывать.
Кто возмется за эту простую прогу? Если уж такой парсер собрали, думаю эту будет легче собрать.
В идеале хотелось бы видеть там несколько строчек для ввода:
от Id и до Id
куда сохранять эти файлы.
Большего и не надо =)
>> No. 5490    
Почему то не все звездочки отобразились,
http://e621.net/post/show/172881
вместо последних цифр были звездочки.
>> No. 5677    
Файл: 132093713530.jpg-(128.78KB, 1000x1414, A_N_T - 201111091548.jpg)
5677
Скачивалка pixiv устарела вроде, а есть более новая версия?
>> No. 5730    
http://410chan.ru/dev/res/4777.html
здесь новые версии и продолжение треда
>> No. 6071    
>>1186
>Fatal error: Call to undefined function curl_init() in localhost\booru\booru.php on line 13
Ок?
[Назад] [Вся нить] [Первые 100 сообщений] [Последние 50 сообщений]


Удалить сообщение []
Пароль  
[Mod]