[WT] [Архив] [Поиск] Главная Управление
[Совместно с Ычаном]

[Назад] [Вся нить] [Первые 100 сообщений] [Последние 50 сообщений]
Ответ в нить [Последние 50 сообщений]
Имя
Animapcha image [@] [?]
Тема   ( ответ в 4777)
Сообщение flower
Файл 
Пароль  (для удаления файлов и сообщений)
Параметры   
  • Прежде чем постить, ознакомьтесь с правилами.
  • Поддерживаемые типы файлов: 7Z, BZ, BZ2, GIF, GZ, JPG, MO, MP3, OGG, PDF, PNG, PSD, RAR, SVG, SWF, TXT, XCF, ZIP
  • Максимально допустимый размер файлов: 10000 кБ.
  • Изображения, размер которых превышает 200 на 200 пикселей, будут уменьшены.
  • Ныне 1490 unique user posts. Посмотреть каталог
  • Радио:

Файл: 130791552285.jpg-(109.96KB, 594x594, bump.jpg)
4777 No. 4777 watch    
Предыдущий >>773 тред внезапно и незаметно ушел в бамплимит. Новый тред будет здесь.
466 сообщений пропущено. Показаны 50 последних сообщений Развернуть все изображения
>> No. 6118    
Файл: 132724304247.jpg-(40.65KB, 750x600, -4chan-STFU-NO_U.jpg)
6118
>>6110
А кто лиги читает?


Опишу ка я свою проблему.
Мне надоело запускать множество копий одной и той же программы для выкачивания по одному тегу с кучи бурр. Мало того, что программа не позволяет удобно выбрать нужныю борру прямо в окне (Хочется выделять их галками), так ещё и не поддерживается спецефичный синтаксис бурр.
Princess_Mononoke
Хочется скачать всё, что есть по ней. В запросе я явно хочу указывать какое слово основное и побочное. А программа может сама ещё добавлять специфичные теги. К примеру: Искать только по слову Mononoke или по такому "Princess Mononoke" (без пробела). Можно добавить автоматическое исключение результатов с ненужным тегом.


И конечно же заебало открывать много окон, хочется одно окно на одну задачу.

Жду 2.0
>> No. 6119    
Файл: 132724369226.png-(71.38KB, 736x736, 1307846752956.png)
6119
Залил Graber 1.1.0.11:

- выключил возможность не включать интервал запросов (query interval) для е/эксхентай;

- выключил возможность не включать интервал запросов между страницами (before getting url) для е/эксхентай;

- поставил минимальный интервал = 1;

- теперь интервал можно указывать в долях секунд (дробным числом);

- добавил обработку предупреждения о слишком быстром листании страниц для е/эксхентай;

- добавил обработку "Ваш IP временно заблокирован" для е/эксхентай;

- добавил обработку закончившихся GP для е/эксхентай;

- добавил обработку пикчки ошибки 509 (наверное, для сравнения использовал размер и MD5 файла). Если все-таки кто-то скажет URL на эту пикчку - буду благодарен.

/ казалось бы какие еще могут быть косяки со скачкой с е/эксхентай, но есть человек, который умудрился получить кучу одинаковых пикч с фоткой неизвестной тян азиатской внешности. Если кто-то еще столкнется с подобным - хотелось бы узнать, что он для этого сделал.

- "переехал" rule34.booru.org на rule34.xxx;

- после ввода логина и пароля через "кнопку с ключиком" старые куки борды будут стерты.


Прямо не знаю, что и сказать.
Разве что - борись с неправильно закачанными пикчами через проверку полученного MD5 файла с сайта. Чекбокс обязателен
>> No. 6120    
Файл: 132724581996.png-(76.51KB, 812x585, sincesummer2012.png)
6120
>>6118
just like pic related
>так ещё и не поддерживается спецефичный синтаксис бурр
what? что пишешь на буре, то точнехонько подходит и в программе
>А программа может сама ещё добавлять специфичные теги
и музон по настроению включать =_=

>>6119
>Разве что - борись с неправильно закачанными пикчами
too slow
>новый (0.7) новогодний релиз первой версии грабера
>- попытался решить проблему с недокачивающимися файлами, сделав проверку на размер файла после скачки пикчи. Тех, кто сталкивался с проблемой, прошу отписаться после тестирования, т.к. сам я эту проблему никак не смог воспроизвести ( issue #20 , issue #21 ).
>> No. 6121    
Файл: 132725662479.jpg-(4.67KB, 200x199, 12769615166391.jpg)
6121
>>6120
>what? что пишешь на буре, то точнехонько подходит и в программе
Когда начинаешь качать с нескольких бурр, тогда начинаются проблемы. Неужели так трудно придумать синтаксис запроса с нескольких бурр одновременно? И фильтровать найденное?
>> No. 6122    
Файл: 132725735253.jpg-(153.81KB, 520x520, 1280773454101.jpg)
6122
>>6120
А можно 2.0a в тред :3 ?
>> No. 6124    
Файл: 132725996524.jpg-(29.42KB, 532x400, GHOST HOUND - 02[(034321)17-06-32].jpg)
6124
>>6121
но ведь грабер 1.0 не поддерживает мультизагрузку, так что никаких проблем.

>>6122
Он только списки пока и умеет получать.
>> No. 6126    
Братюни, Минитокио далеко не всё качает.

Чобиты - 252 обоины, он нашёл только 131.

Он хапает первую половину каждой страницы (6 строчек по две картинки), а вторую половину пропускает.
>> No. 6127    
>>6126
это потому, что ты заходишь как анон. Все пикчи открываются тем, кто логинится.
>> No. 6128    
>добавил обработку закончившихся GP для е/эксхентай;
Как связаны GP и граббер?

Алсо не делай мультизагрузку. Одна борда - один тег, все. Сам же говорил, что жадность не нужна.
>> No. 6129    
>>6128
Это не GP и граббер связаны друг с другом, это граббер связан с е/эксхентай. Есть возможность качать плономасштабки - есть ошибка не хватающих GP.

Ты не верно мыслишь. По одному тэгу с разных борд тоже есть смысл качать тупо потому, что на разных бордах может не оказаться одних и тех же пикч, тем самым мультизагрузка немного "расширяет рамки". Дубли, по возможности, прога будет стараться убирать (правила будут настраиваться пользователем), ну или в конечном итоге оставит это на пользователя. Другое дело - разрешение качать по "tag = ''". По дефолту я выключу такую возможность, но в новой версии это все равно будет легко обойти в силу универсальности скриптов.
>> No. 6130    
Забей в gelbooru любой тег. Похоже там что-то сломалось.
>> No. 6131    
>>6130
На 2й странице останавливается?
>> No. 6133    
>>6131
Да.
>> No. 6136    
>>6133
>>6085
>> No. 6137    
Файл: 132758905671.jpg-(300.21KB, 1024x768, e166fb.jpg)
6137
>>6136
Спасибо.
>> No. 6180    
Как устранить ошибку "query limit exceeded" при скачивании больших галерей с девиантарта? C гелбуры, кстати, скачивает далеко не всё. К примеру, по Слеерам там значится более 900 картинок, а список ссылок около 600. Так по многим тегам.
>> No. 6182    
>>6180
Можно разбить запрос на категории, копируешь ссылку на категорию (пример browse.deviantart.com/digitalart/), вставляешь в редактор категорий, набиваешь так несколько строчек (сам посмотри, если в категории больше 5к пикч, то возьми более глубокий уровень), и врубаешь получение списка. Других способов обойти лимит нет.
Грабер берет строго все, что выдает gui, если в gui этого нет, значит и в грабере нет. Можешь лично посчитать все картинки, если не веришь.
Асло даже API выдает 603
gelbooru.com/index.php?page=dapi&s=post&q=index&tags=slayers
>> No. 6186    
>>6180
на гелбуре засчитываются все удалённые (низкое качество/повторение) картинки. в результате из-за прерываний баннера >>6085 совершенно невозможно узнать, все ли картинки подгрузились в список
>> No. 6187    
Файл: 132808891665.jpg-(196.02KB, 805x743, 23023948_p1.jpg)
6187
>>6186
Кстати, уже хренову тучу времени забываю сделать "тормозилку" с продолжением на этом банере.
>> No. 6220    
Попробовал скинуть весь список тегов с одной бору, выглядящий как облако тегов(пример - http://rule63.paheal.net/tags), и столкнулся со следующей траблой - теги из нескольких слов делятся на слова, а так как таких тегов довольно много, то быстро это исправить вручную нельзя.

Возможно ли добавить в программу или отдельно учет тегов, состоящих из нескольких слов?
>> No. 6223    
>>6220
Я не понел зачем. При поиске все равно все пробелы заменяются на подчеркивания.
>> No. 6225    
Разработчик-кун, с загрузкой с Deviant'a непонятно:
Грабер загружает только версию картинки, которая отображается непосредственно на странице, уменьшеную, а по линку "Download Image" (полноразмерная картинка) не идёт.
Или для этого нужно в грабер ввести логин и пароль для аккаунта на Девианте?

И да - спасибище за столь чудесную разработку!
>> No. 6226    
>>6225
Разлогинился на Девианте, но линк на загрузку полноразмерной пикчи присутствует всё равно. Значит дело не в авторизации, видимо.
>> No. 6231    
Доставьте сслыку на последнюю версию lolibaka parser. Гугл находит только старые версии. Заранее благодарен.
>> No. 6232    
>>6225>>6226
Уже не помню, как там обстоят дела, но вполне возможно. Вообще на этих выходных выпал из реальности и так нифига не сделал, постараюсь сегодня последние фиксы сделать.
>>6231
А он еще обновляется? Здесь в /dev/е инфы что-то не проскакивало.
>> No. 6233    
>>6225
Между прочим говоря, все-таки когда говоришь о проблеме, надо хотя бы 2 вещи указать: ключевые слова для поиска, и ссылка на пикчу, чтобы можно было с ходу посмотреть на проблему =_=
>> No. 6236    
Постоянно высвечивается Read time out. При загрузке ссылок редко, при загрузке картинок 2/3 с такой ошибкой не загружаются, с чем может быть связано?
>> No. 6237    
>>6236
На ore.imouta так. Остальные вроде нормально.
>> No. 6238    
>>6237
Либо у тебя интернеты медленные, либо от имоуты до тебя ответ долгий. Если много потоков стоит - попробуй уменьшить, возможно стоит ограничение канала на один IP, и поэтому скачки по слишком долго "висят".

Наверное, стоит сделать возможность регулировать таймауты.
>> No. 6239    
>>6237
Ах да, и торренты тоже влиять могут :3
>> No. 6240    
>>6238
>>6239
Спасибо, с проблемой разобрался. Виноват был антивирус, сейчас буду крутить настройки.

А можно как-нибудь убрать ограничение длины имени файла? Теги не все влезают даже если качать в корень диска. А еще лучше было бы прикрутить кастомную маску по которой будет составляться имя файла.
>> No. 6244    
>>6233
Извини, протупил.
Пробовал загружать по тегу 343guiltyspark (это автор).
Вот ссылка на всю галерею: http://343guiltyspark.deviantart.com/gallery/?catpath=/
А вот ссылка на конкретную картинку: http://343guiltyspark.deviantart.com/art/Bhagavad-Gita-Visvarupa-Darsana-Pt2-273385811
Собсна, так было со всеми картинками, которые имели ссылку "download image", а на странице отображался уменьшеный вариант.
>> No. 6245    
>>6240
Попробуй сделать название файла длиннее 255 символов. Венда темя мягко пошлет.

>>6244
Я вспомнил, что там не так. Превью по тамбу можно узнать, а вот фуллсайз уже имеет другую ссылку
th03.deviantart.net/fs70/150/i/2011/344 /d/7/ bhagavad_gita__visvarupa_darsana_pt2_by_343guiltyspark-d4irlub.jpg
fc00.deviantart.net/fs70/i/2011/344 /d/7/ bhagavad_gita__visvarupa_darsana_pt2_by_343guiltyspark-d4irlub.jpg
fc04.deviantart.net/fs70/f/2011/344 /2/d/ bhagavad_gita__visvarupa_darsana_pt2_by_343guiltyspark-d4irlub.jpg

В общем, тогда прикручу галочку, с которой скачка станет чуть медленней, но зато с фуллсайзами.
>> No. 6246    
>>6245
Было бы отлично. Спасибо :3
>> No. 6248    
Файл: 132861424691.jpg-(616.15KB, 843x1473, 23762704.jpg)
6248
Graber 1.1.0.13 http://goo.gl/Im19g :
- баннер в GUI gelbooru.org теперь благополучно пропускается (не прошло и года же);
- с deviantart.com теперь в первую очередь качаются фуллсайзовые картинки ;
- таймауты теперь можно настроить. 0 = без таймаута.
>> No. 6250    
Файл: 132866381932.gif-(3.11KB, 35x25, _bird__by_CookiemagiK.gif)
6250
>>6248
Спасибо, няша!

Докладываю о результатах сохранения с девианта.
Сохранял по тегу redjuice999 (автор) ( http://redjuice999.deviantart.com/ ). Фулсайзы сохраняет ок.
Но не обошлось без нюансов, но уже по другому поводу:

Ввёл в прогу логин и пароль, запустил поиск. Нашлось и в последствии сохранилось 204 картинки.
Однако на девианте поиск выдаёт: "232 most popular deviations of all time for redjuice999". Такое девиант пишет, когда юзер и залогинен и когда разлогинен, но в последнем случае, не смотря на тот же текст о 232-х картинках, в списке невзначай отсутствуют картинки, помеченные как "mature content".
Просмотрев загруженные картинки, действительно не обнаружил тех, которые были mature. Например этих:
http://redjuice999.deviantart.com/art/WATERFRONT-238930334
http://redjuice999.deviantart.com/art/Summer-239015191
Всего у него в галерее 11 mature картинок.
Тоесть, выходит, что нэко-лапа не может залогиниться?

Ну и сразу второй вопрос: можно ли как-то сохранить галерею одного конкретного автора, а не все результаты из поиска? Так, например, в вышеописанном примере в галерее у redjuice999 всего 77 картинок. Тоесть пришлось просмотреть папку с загруженными пикчами и вручную удалить 138 левых, а потом вручную досохранить 11 помеченных как mature.
Но это, наверное, уже вопрос о том, что парсить: либо результаты поиска, либо непосредственно галерею автора.
>> No. 6251    
Так точно, логиниться на деваче он не может, хотя прикрутить не сложно, прикручу тогда в след. версии. Но не факт, что что-то изменится, т.к. грабер выбирает те пикчи, у которых есть параметры оригинальной картинки (superimg_*), чтобы отфильтровывать флешки, тексты и т.п. непонятного содержимого контент, который никак не помечается среди тэгов. Вообще это отдельная тема для медитации.
Качать по автору можно прикрутить, но когда - хз.
>> No. 6268    
>>6129
>Это не GP и граббер связаны друг с другом, это граббер связан с е/эксхентай. Есть возможность качать плономасштабки - есть ошибка не хватающих GP.
Я ничего не понял, зачем ты что-то делаешь с GP, если они не нужны для закачки оригиналов?
>> No. 6277    
>6268
А вот и не угадал, где-то через 10 пикч начинает трясти GP.
>> No. 6279    
>>6277
О как, не знал.
>> No. 6306    
Файл: 132939451254.jpg-(7.23KB, 200x200, 12769610853143.jpg)
6306
Gtaber 1.1.0.14:

- прикрутил авторизацию на devianart'е. Тем не менее особенной разницы, что и без авторизации, нет. Для входа надо указать хотя бы логин, иначе загрузка начнется анонимно. Воход происходит по HTTPS, поэтому придется скачать и скинуть в папку с программой библиотеки OpenSSL (см. раздел загрузок);



ПО поводу скачивания дополнительного софта - неужели было так трудно СРАЗУ скинуть эту либу в архив с программой?
>> No. 6365    
Файл: 13302212662.jpg-(200.39KB, 1700x1734, 12769556134779.jpg)
6365
>>6306
Пишу здесь идеи:

Итак - можно сделать галку для удаления тега, по которому искали из списка тегов добавляемого к имени? (Про более подробное переименование файлов молчу)

Сделаешь возможность добавлять дополнительные параметры в строку поиска? (Пример - сканируем выбранные бору по тегу и ищем с размерами ровно 1920*1200. Или ишем по тегу и скачиваем то, что не содержит другой тег). Эти параметры реализует сама программа.
>> No. 6415    
Файл: 13306984407.jpg-(43.79KB, 720x630, 111.jpg)
6415
Кажется гелбору успешно защищается от даунлодеров. Теперь вместо картинок скачиваются ошибки
>> No. 6426    
>>6415
>http://gelbooru.com/[b]thumbnails[/b]/blablabla
Такие дела.
>> No. 6467    
Два вопроса, где кнопка Clear, и может ли граббер искать на эххентае именно по тегу, а не в поиске, т.к. в случае с коротким тегом выдаёт тысячи попаданий.
>> No. 6474    
можно ли исключить из граббинга е621, к примеру, тег gay или female? -female не работает
>> No. 6529    
бамплимит?
>> No. 6536    
http://rule34.paheal.net
НЕ РАБОТАЕТ
>> No. 7638    
>>4777

У меня есть идея. Давайте мы будет выкладывать свои ТОННЫ картинок на хостингах и наши соседи будут их сохранять. А что? Счёт объёма жёстких дисков сейчас идёт на терабайты!
>> No. 8213    
Доставьте исходники, плиз.
[Назад] [Вся нить] [Первые 100 сообщений] [Последние 50 сообщений]


Удалить сообщение []
Пароль  
[Mod]