Обновление программы для распознавания текста dpScreenOCR 1.5.1

25.04.2026 07:54 (MSK)

Состоялся выпуск программы для оптического распознавания текста dpScreenOCR 1.5.1, использующей Tesseract. dpScreenOCR позволяет при помощи глобальной горячей клавиши и мыши захватить произвольную область экрана, текст из которой будет распознан. В зависимости от выбора пользователя, программа может копировать распознанный текст в буфер обмена, добавить его в историю или отправить внешней программе. Готовые сборки сформированы для Linux и Windows (также доступны репозитории пакетов для Debian и Ubuntu). Код программы написан на C++ и распространяется под лицензией zlib.

В новой версии:

OCR-движок Tesseract обновлён до версии 5.5.2.
Программа стала доступна в Microsoft Store.
В репозитории для Debian и Ubuntu предоставлены сборки для архитектуры AArch64.
Исправлена проблема, из-за которой при запуске программы на короткое время появлялись пустые окна.
Обновлены переводы на хорватский и французский языки.

исправить +13 +/–

Автор новости: Аноним

Лицензия: CC BY 3.0

Короткая ссылка: https://opennet.ru/65281-dpscreenocr

Ключевые слова: dpscreenocr, ocr

При перепечатке указание ссылки на opennet.ru обязательно

Обсуждение (37)

1.1, Аноним (1), 08:03, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]	–3 +/–
Кто-нибудь уже натренировал и слил в сеть нормальные модели для tesseract? Штатная слабовато распознаёт, много ошибок и требовательно к чистоте картинки. И наклону. Желательно без стилеров токенов и ботнетов комплектом.

2.5, Аноним (5), 08:53, 25/04/2026 [^] [^^] [^^^] [ответить]	+1 +/–
прекрасно он текст распознает, но нужно чтобы распознаваемый шрифт входил во мн-во на котором он учился. Переобучение несложно локально сделать, там файлик со списком шрифтов есть

3.6, Аноним (1), 08:58, 25/04/2026 [^] [^^] [^^^] [ответить]	+3 +/–
С ошибками. Мне иероглифы вообще распознавать надо. У гугла вон работает распознавание по фото с любым текстом под любым углом, а тут приходится вращать, выкручивать контрастность, двухцветные изображения делать. Не сказал бы, что это прекрасно, как минимум, нужны нормальные веса.

4.10, Анонимище (?), 09:18, 25/04/2026 [^] [^^] [^^^] [ответить]	+/–
А почему Вам нужно распозновать иероглифы, простите за любопытство?

5.12, Аноним (1), 09:42, 25/04/2026 [^] [^^] [^^^] [ответить]	–1 +/–
Много китайской продукции и я не владею китайским, одна надежда на переводчик. Посылать всё в гугл для распознавания, конечно, замечательная идея, но у неё есть свои недостатки.

6.18, Анонимище (?), 10:17, 25/04/2026 [^] [^^] [^^^] [ответить]	+/–
И что за недостатки?

7.19, Аноним (1), 10:22, 25/04/2026 [^] [^^] [^^^] [ответить]	+1 +/–
> И что за недостатки? Гугл блокирует подсеть. Или хочет денег.

8.22, faa (?), 14:39, 25/04/2026 [^] [^^] [^^^] [ответить]	+/–
А если послать какому-нибудь дипсику или квен ... текст свёрнут, показать

9.24, ryoken (ok), 15:52, 25/04/2026 [^] [^^] [^^^] [ответить]	+/–
В расчете на родной язык авторов ... текст свёрнут, показать

4.20, Анонисссм (?), 10:45, 25/04/2026 [^] [^^] [^^^] [ответить]	+1 +/–
>Мне иероглифы вообще распознавать надо tesseract прекрасно и раз в 10 быстрее работает, если НЕ нужны таблицы и прочее сложное форматирование, возможно китайский тоже не умеет. paddleOCR и подобное тебе нужно

4.25, Аноним (25), 15:52, 25/04/2026 [^] [^^] [^^^] [ответить]	+/–
> Мне иероглифы вообще распознавать надо > тут приходится вращать, выкручивать контрастность, двухцветные изображения делать Сабж, насколько понимаю, делает такие приготовления для изображений: у него качество распознавания несоизмеримо лучше, чем у голого консольного tesseract. Хотя я сравнивал для англичского и русского, а не для иероглифов.

4.34, tkzv (ok), 09:52, 26/04/2026 [^] [^^] [^^^] [ответить]	+/–
Короткие тексты иероглифами tesseract распознаёт отлично, хотя многоцветные и длиннее 200 знаков особо распознавать не приходилось. Вместо возни с контрастностью предпочитаю сразу распознать на нескольких уровнях гаммы — от 0,06 до 8 — и выбрать лучший. Забавно, что часто с гаммой и 2, и 0,5 получается одинаково хорошо, и гораздо лучше, чем с 1.

3.8, Профессор Кислвх Щей (?), 09:07, 25/04/2026 [^] [^^] [^^^] [ответить]	+/–
Так это ужасно. Она не должна знать то что распознает. Конечно у нее точное будет, если она видела этот пример

2.27, Jh (?), 16:52, 25/04/2026 [^] [^^] [^^^] [ответить]	+/–
Я пробовал распознавать на сканах ксерокопий 200dpi, нормально распознает. Что не хватает так это работы с таблицами.

1.2, Аноним (2), 08:21, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]	+1 +/–
а на вяленом будет работать? :D

1.3, Аноним (3), 08:29, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]	–2 +/–
>использующей Tesseract Tesseract - это хлам. Я ожидал, что таки навайбкодят аналог файнридера на нейронках, но видимо неподъёмно.

2.40, Аноним (40), 03:35, 28/04/2026 [^] [^^] [^^^] [ответить]	+/–
Куча открытых моделей есть мультимодальных, которые умеют речь и картинки распознавать (ну, соответственно, как OCR работать). qwen3.6, gemma4 из последних.

1.4, Аноним (-), 08:37, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]	–5 +/–
> Программа стала доступна в Microsoft Store. Дожили, опеннет постит ссылки на коммерческий блобоварезник майкрософта :\

2.9, Аноним (9), 09:08, 25/04/2026 [^] [^^] [^^^] [ответить]	+4 +/–
И по этой ссылке опенсорсное приложение. Вроде бы все в пределах философии опенннета.

2.11, Аноним (11), 09:26, 25/04/2026 [^] [^^] [^^^] [ответить]	+/–
Написал так, как будто у вас процессор не на технологиях ASML разработан.

2.13, Аркагоблин (?), 09:48, 25/04/2026 [^] [^^] [^^^] [ответить]	+1 +/–
И что? Сама программа с открытым исходным кодом (лицензия zlib), а Microsoft Store лишь один из вариантов распространения. Firefox, LibreOffice и даже Ubuntu тоже там доступны, и что?

2.28, Аноним (25), 19:24, 25/04/2026 [^] [^^] [^^^] [ответить]	+/–
>> Программа стала доступна в Microsoft Store. > Дожили, опеннет постит ссылки на коммерческий блобоварезник майкрософта :\ Подавляющее большинство людей предпочтет установить программу из официального магазина, а не качать-запускать непонятно какие EXE с васянских сайтов.

3.31, Аноним (31), 03:48, 26/04/2026 [^] [^^] [^^^] [ответить]	+/–
Подавляющее большинство людей не пользуются официальным магазином, а предпочитают как и всегда качать непосредственно с сайта.

4.39, Прохожий (??), 01:35, 27/04/2026 [^] [^^] [^^^] [ответить]	+/–
Подавляющее число вменяемых людей пользуются Chocolatey или Winget, или чем-то аналогичным и не ходят ни по каким сайтам или магазинам.

1.14, Аркагоблин (?), 09:51, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Как раз на днях искал программу для распознавания текста из изображений (не китайский глянцевый хлам на непонятном стеке, с рекламой и VIP подпиской), и сегодня узнал об этой программе

2.21, Смузихлеб забывший пароль (?), 13:25, 25/04/2026 [^] [^^] [^^^] [ответить]	+/–
> китайский глянцевый хлам на непонятном стеке, с рекламой и VIP подпиской ты примерно описал среднестатистическое приложение яблостора( десктоп )

1.17, psv (??), 10:10, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]	+/–
И что никто не поставил в ламу локальную Qwen3.6-35b "смесь экспертов" с указанием "грузить картинки тоже"? )))

1.23, Аноним (23), 15:03, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]	+/–
не проще скрин в дипсик скинуть?

2.26, Аноним (25), 15:58, 25/04/2026 [^] [^^] [^^^] [ответить]

+/–

> не проще скрин в дипсик скинуть?

Не проще. Сабж без лишних телодвижений сразу распознает скрины дает результат в буфер обмена. Это банально быстрее, чем куда-то что-то загружать и потом выделять-копировать вручную.

Ну и работает оффлайн без необходимости сливать свои данные третьим лицам.

1.29, Аноним (29), 19:38, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]	+1 +/–
Tesseract всё ещё работает ужасно?

2.32, жыжа (?), 03:56, 26/04/2026 [^] [^^] [^^^] [ответить]	+1 +/–
Весьма посредственно, если судить по spectacle, куда недавно завели распознавание текста на скринах через tesseract, и распознать смесь русского с английским, похоже, задача непосильная.

2.35, tkzv (ok), 10:02, 26/04/2026 [^] [^^] [^^^] [ответить]

+/–

> Tesseract всё ещё работает ужасно?

Для распознавания скриншотов текста — более чем достаточно. Если весь текст одного размера и цвета, и достаточно контрастный. Проблемы бывают со светлосерым на белом (лечится прогоном через magick -gamma), с жёлтым на голубом (аналогично), при размере текста меньше 6 пикселов.

Если текст нескольких цветов, иногда приходится распознавать с разными гаммами и компоновать.

Если текст на нескольких языках, может подставить символы не того языка. HET, 3EB, НЕАР и т.д.

1.30, Петр А. (?), 21:49, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Еще в коллекцию? https://www.altlinux.org/OCR

1.33, Ю.Т. (?), 08:26, 26/04/2026 [ответить] [﹢﹢﹢] [ · · · ]

+1 +/–

Тессеракт имеет "нейронки" уже лет 10 почти.

Со "смесью языков" он работает, возможно, не блестяще, но и не плохо.

Китайский в нём есть, и "новый", и "старый".

Работать нужно, понятно же, с лучшим набором:
github.com/tesseract-ocr/tessdata_best

Чего не хватает тессеракту -
1 никак не родят к нему путёвый разбиватель страницы. Собственный там старый и довольно упрощённый.
2 Семантика текста, выражаемая размерами, положениями и начертаниями (выделения,дроби, индексы, сноски), не обрабатывается.
3 Их обучающие наборы данных скромноваты по размерам (не забудем, конечно, что их собирают и раздают бесплатно)
4 Также реализованная в тессеракте модель машобучения не позволяет её удобно доообучить.

2.36, tkzv (ok), 10:14, 26/04/2026 [^] [^^] [^^^] [ответить]

+/–

> Со "смесью языков" он работает, возможно, не блестяще, но и не плохо.

Прикрутить бы LanguageTool какой-нибудь. Чтобы меньше путал "не" и "he".

> 1 никак не родят к нему путёвый разбиватель страницы. Собственный там старый и довольно упрощённый.

Сейчас проще руками разбить картинку на несколько, чем надеяться, что распознает колонки.

> 2 Семантика текста, выражаемая размерами, положениями и начертаниями (выделения,дроби, индексы, сноски), не обрабатывается.

Вообще какая-нибудь программа это умеет?

> 4 Также реализованная в тессеракте модель машобучения не позволяет её удобно доообучить.

Если я правильно понял документацию, обучение медленное и не умеет пользоваться GPU.

От себя добавлю внезапные затыки, когда в упор не видит не очень контрастный текст, но при изменении гаммы в любую сторону прекрасно всё распознаёт. И очень плохо распознаёт, если на черно-белом скриншоте что-то подчёркнуто или обведено красным.

3.37, Ю.Т. (?), 12:09, 26/04/2026 [^] [^^] [^^^] [ответить]

+/–

> Прикрутить бы LanguageTool какой-нибудь. Чтобы меньше путал "не" и "he".

Думаю, такие действия лучше бы получать из мета-описаний. "Текст содержит целые слова в разных системах письма", а отсюда и вариант: "В тексте просто есть римские числа".

То же и к разбивателю относится. Глаз-мозг у всех одинаковы (с точки зрения такой задачи), так что не так много и сценариев выкладки (лучше сказать -- признаков?).

> Вообще какая-нибудь программа это умеет?

Кажется, нет. Но это как бы и не задача распознавалки, скорее - для средств постобработки.

Да, разноцветный текст тессеракт не любит. Но там и предобработка - оочень скупая.

1.38, Сладкая булочка (?), 18:12, 26/04/2026 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Госопода, подскажите, он же с формулами так и не научился работать? Что посоветуете для распознавания формул?

игнорирование участников | лог модерирования

Добавить комментарий

Текст: