| 1.1, Аноним (1), 08:03, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]
| –3 +/– |
Кто-нибудь уже натренировал и слил в сеть нормальные модели для tesseract? Штатная слабовато распознаёт, много ошибок и требовательно к чистоте картинки. И наклону. Желательно без стилеров токенов и ботнетов комплектом.
| | |
| |
| 2.5, Аноним (5), 08:53, 25/04/2026 [^] [^^] [^^^] [ответить]
| +1 +/– |
прекрасно он текст распознает, но нужно чтобы распознаваемый
шрифт входил во мн-во на котором он учился. Переобучение
несложно локально сделать, там файлик со списком шрифтов есть
| | |
| |
| 3.6, Аноним (1), 08:58, 25/04/2026 [^] [^^] [^^^] [ответить]
| +3 +/– |
С ошибками. Мне иероглифы вообще распознавать надо. У гугла вон работает распознавание по фото с любым текстом под любым углом, а тут приходится вращать, выкручивать контрастность, двухцветные изображения делать. Не сказал бы, что это прекрасно, как минимум, нужны нормальные веса.
| | |
| |
| |
| 5.12, Аноним (1), 09:42, 25/04/2026 [^] [^^] [^^^] [ответить]
| –1 +/– |
Много китайской продукции и я не владею китайским, одна надежда на переводчик. Посылать всё в гугл для распознавания, конечно, замечательная идея, но у неё есть свои недостатки.
| | |
| |
| |
| 7.19, Аноним (1), 10:22, 25/04/2026 [^] [^^] [^^^] [ответить]
| +1 +/– | |
> И что за недостатки?
Гугл блокирует подсеть. Или хочет денег.
| | |
|
|
|
| 4.20, Анонисссм (?), 10:45, 25/04/2026 [^] [^^] [^^^] [ответить]
| +1 +/– | |
>Мне иероглифы вообще распознавать надо
tesseract прекрасно и раз в 10 быстрее работает, если НЕ нужны таблицы и прочее сложное форматирование, возможно китайский тоже не умеет. paddleOCR и подобное тебе нужно
| | |
| 4.25, Аноним (25), 15:52, 25/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
> Мне иероглифы вообще распознавать надо
> тут приходится вращать, выкручивать контрастность, двухцветные изображения делать
Сабж, насколько понимаю, делает такие приготовления для изображений: у него качество распознавания несоизмеримо лучше, чем у голого консольного tesseract. Хотя я сравнивал для англичского и русского, а не для иероглифов.
| | |
| 4.34, tkzv (ok), 09:52, 26/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
Короткие тексты иероглифами tesseract распознаёт отлично, хотя многоцветные и длиннее 200 знаков особо распознавать не приходилось.
Вместо возни с контрастностью предпочитаю сразу распознать на нескольких уровнях гаммы — от 0,06 до 8 — и выбрать лучший. Забавно, что часто с гаммой и 2, и 0,5 получается одинаково хорошо, и гораздо лучше, чем с 1.
| | |
|
|
| 2.27, Jh (?), 16:52, 25/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
Я пробовал распознавать на сканах ксерокопий 200dpi, нормально распознает. Что не хватает так это работы с таблицами.
| | |
|
| 1.3, Аноним (3), 08:29, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]
| –2 +/– | |
>использующей Tesseract
Tesseract - это хлам. Я ожидал, что таки навайбкодят аналог файнридера на нейронках, но видимо неподъёмно.
| | |
| |
| 2.40, Аноним (40), 03:35, 28/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
Куча открытых моделей есть мультимодальных, которые умеют речь и картинки распознавать (ну, соответственно, как OCR работать). qwen3.6, gemma4 из последних.
| | |
|
| 1.4, Аноним (-), 08:37, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]
| –5 +/– | |
> Программа стала доступна в Microsoft Store.
Дожили, опеннет постит ссылки на коммерческий блобоварезник майкрософта :\
| | |
| |
| 2.9, Аноним (9), 09:08, 25/04/2026 [^] [^^] [^^^] [ответить]
| +4 +/– |
И по этой ссылке опенсорсное приложение. Вроде бы все в пределах философии опенннета.
| | |
| 2.11, Аноним (11), 09:26, 25/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
Написал так, как будто у вас процессор не на технологиях ASML разработан.
| | |
| 2.13, Аркагоблин (?), 09:48, 25/04/2026 [^] [^^] [^^^] [ответить]
| +1 +/– |
И что? Сама программа с открытым исходным кодом (лицензия zlib), а Microsoft Store лишь один из вариантов распространения. Firefox, LibreOffice и даже Ubuntu тоже там доступны, и что?
| | |
| 2.28, Аноним (25), 19:24, 25/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
>> Программа стала доступна в Microsoft Store.
> Дожили, опеннет постит ссылки на коммерческий блобоварезник майкрософта :\
Подавляющее большинство людей предпочтет установить программу из официального магазина, а не качать-запускать непонятно какие EXE с васянских сайтов.
| | |
| |
| 3.31, Аноним (31), 03:48, 26/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
Подавляющее большинство людей не пользуются официальным магазином, а предпочитают как и всегда качать непосредственно с сайта.
| | |
| |
| 4.39, Прохожий (??), 01:35, 27/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
Подавляющее число вменяемых людей пользуются Chocolatey или Winget, или чем-то аналогичным и не ходят ни по каким сайтам или магазинам.
| | |
|
|
|
| 1.14, Аркагоблин (?), 09:51, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Как раз на днях искал программу для распознавания текста из изображений (не китайский глянцевый хлам на непонятном стеке, с рекламой и VIP подпиской), и сегодня узнал об этой программе
| | |
| |
| 2.21, Смузихлеб забывший пароль (?), 13:25, 25/04/2026 [^] [^^] [^^^] [ответить]
| +/– | |
> китайский глянцевый хлам на непонятном стеке, с рекламой и VIP подпиской
ты примерно описал среднестатистическое приложение яблостора( десктоп )
| | |
|
| 1.17, psv (??), 10:10, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
И что никто не поставил в ламу локальную Qwen3.6-35b "смесь экспертов" с указанием "грузить картинки тоже"? )))
| | |
| |
| 2.26, Аноним (25), 15:58, 25/04/2026 [^] [^^] [^^^] [ответить]
| +/– | |
> не проще скрин в дипсик скинуть?
Не проще. Сабж без лишних телодвижений сразу распознает скрины дает результат в буфер обмена. Это банально быстрее, чем куда-то что-то загружать и потом выделять-копировать вручную.
Ну и работает оффлайн без необходимости сливать свои данные третьим лицам.
| | |
|
| |
| 2.32, жыжа (?), 03:56, 26/04/2026 [^] [^^] [^^^] [ответить]
| +1 +/– |
Весьма посредственно, если судить по spectacle, куда недавно завели распознавание текста на скринах через tesseract, и распознать смесь русского с английским, похоже, задача непосильная.
| | |
| 2.35, tkzv (ok), 10:02, 26/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
> Tesseract всё ещё работает ужасно?
Для распознавания скриншотов текста — более чем достаточно. Если весь текст одного размера и цвета, и достаточно контрастный. Проблемы бывают со светлосерым на белом (лечится прогоном через magick -gamma), с жёлтым на голубом (аналогично), при размере текста меньше 6 пикселов.
Если текст нескольких цветов, иногда приходится распознавать с разными гаммами и компоновать.
Если текст на нескольких языках, может подставить символы не того языка. HET, 3EB, НЕАР и т.д.
| | |
|
| 1.33, Ю.Т. (?), 08:26, 26/04/2026 [ответить] [﹢﹢﹢] [ · · · ]
| +1 +/– | |
Тессеракт имеет "нейронки" уже лет 10 почти.
Со "смесью языков" он работает, возможно, не блестяще, но и не плохо.
Китайский в нём есть, и "новый", и "старый".
Работать нужно, понятно же, с лучшим набором:
github.com/tesseract-ocr/tessdata_best
Чего не хватает тессеракту -
1 никак не родят к нему путёвый разбиватель страницы. Собственный там старый и довольно упрощённый.
2 Семантика текста, выражаемая размерами, положениями и начертаниями (выделения,дроби, индексы, сноски), не обрабатывается.
3 Их обучающие наборы данных скромноваты по размерам (не забудем, конечно, что их собирают и раздают бесплатно)
4 Также реализованная в тессеракте модель машобучения не позволяет её удобно доообучить.
| | |
| |
| 2.36, tkzv (ok), 10:14, 26/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
> Со "смесью языков" он работает, возможно, не блестяще, но и не плохо.
Прикрутить бы LanguageTool какой-нибудь. Чтобы меньше путал "не" и "he".
> 1 никак не родят к нему путёвый разбиватель страницы. Собственный там старый и довольно упрощённый.
Сейчас проще руками разбить картинку на несколько, чем надеяться, что распознает колонки.
> 2 Семантика текста, выражаемая размерами, положениями и начертаниями (выделения,дроби, индексы, сноски), не обрабатывается.
Вообще какая-нибудь программа это умеет?
> 4 Также реализованная в тессеракте модель машобучения не позволяет её удобно доообучить.
Если я правильно понял документацию, обучение медленное и не умеет пользоваться GPU.
От себя добавлю внезапные затыки, когда в упор не видит не очень контрастный текст, но при изменении гаммы в любую сторону прекрасно всё распознаёт. И очень плохо распознаёт, если на черно-белом скриншоте что-то подчёркнуто или обведено красным.
| | |
| |
| 3.37, Ю.Т. (?), 12:09, 26/04/2026 [^] [^^] [^^^] [ответить]
| +/– |
> Прикрутить бы LanguageTool какой-нибудь. Чтобы меньше путал "не" и "he".
Думаю, такие действия лучше бы получать из мета-описаний. "Текст содержит целые слова в разных системах письма", а отсюда и вариант: "В тексте просто есть римские числа".
То же и к разбивателю относится. Глаз-мозг у всех одинаковы (с точки зрения такой задачи), так что не так много и сценариев выкладки (лучше сказать -- признаков?).
> Вообще какая-нибудь программа это умеет?
Кажется, нет. Но это как бы и не задача распознавалки, скорее - для средств постобработки.
Да, разноцветный текст тессеракт не любит. Но там и предобработка - оочень скупая.
| | |
|
|
| 1.38, Сладкая булочка (?), 18:12, 26/04/2026 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Госопода, подскажите, он же с формулами так и не научился работать? Что посоветуете для распознавания формул?
| | |
|