The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Обновление программы для распознавания текста dpScreenOCR 1.5.1

25.04.2026 07:54 (MSK)

Состоялся выпуск программы для оптического распознавания текста dpScreenOCR 1.5.1, использующей Tesseract. dpScreenOCR позволяет при помощи глобальной горячей клавиши и мыши захватить произвольную область экрана, текст из которой будет распознан. В зависимости от выбора пользователя, программа может копировать распознанный текст в буфер обмена, добавить его в историю или отправить внешней программе. Готовые сборки сформированы для Linux и Windows (также доступны репозитории пакетов для Debian и Ubuntu). Код программы написан на C++ и распространяется под лицензией zlib.

В новой версии:

  • OCR-движок Tesseract обновлён до версии 5.5.2.
  • Программа стала доступна в Microsoft Store.
  • В репозитории для Debian и Ubuntu предоставлены сборки для архитектуры AArch64.
  • Исправлена проблема, из-за которой при запуске программы на короткое время появлялись пустые окна.
  • Обновлены переводы на хорватский и французский языки.


  1. Главная ссылка к новости (https://github.com/danpla/dpsc...)
  2. OpenNews: Выпуск программы для распознавания текста dpScreenOCR 1.5.0
  3. OpenNews: Выпуск системы распознавания текста GNU Ocrad 0.29
  4. OpenNews: Новая система оптического распознавания текста EasyOCR
  5. OpenNews: Новая версия оболочки для распознавания текста YAGF 0.9.4
  6. OpenNews: Релиз системы распознавания текста Tesseract 5.5.0
Автор новости: Аноним
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/65281-dpscreenocr
Ключевые слова: dpscreenocr, ocr
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (37) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (1), 08:03, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • –3 +/
    Кто-нибудь уже натренировал и слил в сеть нормальные модели для tesseract? Штатная слабовато распознаёт, много ошибок и требовательно к чистоте картинки. И наклону. Желательно без стилеров токенов и ботнетов комплектом.
     
     
  • 2.5, Аноним (5), 08:53, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +1 +/
    прекрасно он текст распознает, но нужно чтобы распознаваемый
    шрифт входил во мн-во на котором он учился. Переобучение
    несложно локально сделать, там файлик со списком шрифтов есть
     
     
  • 3.6, Аноним (1), 08:58, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +3 +/
    С ошибками. Мне иероглифы вообще распознавать надо. У гугла вон работает распознавание по фото с любым текстом под любым углом, а тут приходится вращать, выкручивать контрастность, двухцветные изображения делать. Не сказал бы, что это прекрасно, как минимум, нужны нормальные веса.
     
     
  • 4.10, Анонимище (?), 09:18, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    А почему Вам нужно распозновать иероглифы, простите за любопытство?
     
     
  • 5.12, Аноним (1), 09:42, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Много китайской продукции и я не владею китайским, одна надежда на переводчик. Посылать всё в гугл для распознавания, конечно, замечательная идея, но у неё есть свои недостатки.
     
     
  • 6.18, Анонимище (?), 10:17, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    И что за недостатки?
     
     
  • 7.19, Аноним (1), 10:22, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > И что за недостатки?

    Гугл блокирует подсеть. Или хочет денег.

     
     
  • 8.22, faa (?), 14:39, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    А если послать какому-нибудь дипсику или квен ... текст свёрнут, показать
     
     
  • 9.24, ryoken (ok), 15:52, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    В расчете на родной язык авторов ... текст свёрнут, показать
     
  • 4.20, Анонисссм (?), 10:45, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >Мне иероглифы вообще распознавать надо

    tesseract прекрасно и раз в 10 быстрее работает, если НЕ нужны таблицы и прочее сложное форматирование, возможно китайский тоже не умеет. paddleOCR и подобное тебе нужно

     
  • 4.25, Аноним (25), 15:52, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    > Мне иероглифы вообще распознавать надо
    > тут приходится вращать, выкручивать контрастность, двухцветные изображения делать

    Сабж, насколько понимаю, делает такие приготовления для изображений: у него качество распознавания несоизмеримо лучше, чем у голого консольного tesseract. Хотя я сравнивал для англичского и русского, а не для иероглифов.

     
  • 4.34, tkzv (ok), 09:52, 26/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    Короткие тексты иероглифами tesseract распознаёт отлично, хотя многоцветные и длиннее 200 знаков особо распознавать не приходилось.

    Вместо возни с контрастностью предпочитаю сразу распознать на нескольких уровнях гаммы — от 0,06 до 8 — и выбрать лучший. Забавно, что часто с гаммой и 2, и 0,5 получается одинаково хорошо, и гораздо лучше, чем с 1.

     
  • 3.8, Профессор Кислвх Щей (?), 09:07, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    Так это ужасно. Она не должна знать то что распознает. Конечно у нее точное будет, если она видела этот пример
     
  • 2.27, Jh (?), 16:52, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    Я пробовал распознавать на сканах ксерокопий 200dpi, нормально распознает. Что не хватает так это работы с таблицами.
     

  • 1.2, Аноним (2), 08:21, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    а на вяленом будет работать? :D
     
  • 1.3, Аноним (3), 08:29, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • –2 +/
    >использующей Tesseract

    Tesseract - это хлам. Я ожидал, что таки навайбкодят аналог файнридера на нейронках, но видимо неподъёмно.

     
     
  • 2.40, Аноним (40), 03:35, 28/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    Куча открытых моделей есть мультимодальных, которые умеют речь и картинки распознавать (ну, соответственно, как OCR работать). qwen3.6, gemma4 из последних.
     

  • 1.4, Аноним (-), 08:37, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • –5 +/
    > Программа стала доступна в Microsoft Store.

    Дожили, опеннет постит ссылки на коммерческий блобоварезник майкрософта :\

     
     
  • 2.9, Аноним (9), 09:08, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +4 +/
    И по этой ссылке опенсорсное приложение. Вроде бы все в пределах философии опенннета.
     
  • 2.11, Аноним (11), 09:26, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    Написал так, как будто у вас процессор не на технологиях ASML разработан.
     
  • 2.13, Аркагоблин (?), 09:48, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +1 +/
    И что? Сама программа с открытым исходным кодом (лицензия zlib), а Microsoft Store лишь один из вариантов распространения. Firefox, LibreOffice и даже Ubuntu тоже там доступны, и что?
     
  • 2.28, Аноним (25), 19:24, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    >> Программа стала доступна в Microsoft Store.
    > Дожили, опеннет постит ссылки на коммерческий блобоварезник майкрософта :\

    Подавляющее большинство людей предпочтет установить программу из официального магазина, а не качать-запускать непонятно какие EXE с васянских сайтов.

     
     
  • 3.31, Аноним (31), 03:48, 26/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    Подавляющее большинство людей не пользуются официальным магазином, а предпочитают как и всегда качать непосредственно с сайта.
     
     
  • 4.39, Прохожий (??), 01:35, 27/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    Подавляющее число вменяемых людей пользуются Chocolatey или Winget, или чем-то аналогичным и не ходят ни по каким сайтам или магазинам.
     

  • 1.14, Аркагоблин (?), 09:51, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Как раз на днях искал программу для распознавания текста из изображений (не китайский глянцевый хлам на непонятном стеке, с рекламой и VIP подпиской), и сегодня узнал об этой программе
     
     
  • 2.21, Смузихлеб забывший пароль (?), 13:25, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    > китайский глянцевый хлам на непонятном стеке, с рекламой и VIP подпиской

    ты примерно описал среднестатистическое приложение яблостора( десктоп )

     

  • 1.17, psv (??), 10:10, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    И что никто не поставил в ламу локальную Qwen3.6-35b "смесь экспертов" с указанием "грузить картинки тоже"? )))
     
  • 1.23, Аноним (23), 15:03, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    не проще скрин в дипсик скинуть?
     
     
  • 2.26, Аноним (25), 15:58, 25/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    > не проще скрин в дипсик скинуть?

    Не проще. Сабж без лишних телодвижений сразу распознает скрины дает результат в буфер обмена. Это банально быстрее, чем куда-то что-то загружать и потом выделять-копировать вручную.

    Ну и работает оффлайн без необходимости сливать свои данные третьим лицам.

     

  • 1.29, Аноним (29), 19:38, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Tesseract всё ещё работает ужасно?
     
     
  • 2.32, жыжа (?), 03:56, 26/04/2026 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Весьма посредственно, если судить по spectacle, куда недавно завели распознавание текста на скринах через tesseract, и распознать смесь русского с английским, похоже, задача непосильная.
     
  • 2.35, tkzv (ok), 10:02, 26/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    > Tesseract всё ещё работает ужасно?

    Для распознавания скриншотов текста — более чем достаточно. Если весь текст одного размера и цвета, и достаточно контрастный. Проблемы бывают со светлосерым на белом (лечится прогоном через magick -gamma), с жёлтым на голубом (аналогично), при размере текста меньше 6 пикселов.

    Если текст нескольких цветов, иногда приходится распознавать с разными гаммами и компоновать.

    Если текст на нескольких языках, может подставить символы не того языка. HET, 3EB, НЕАР и т.д.

     

  • 1.30, Петр А. (?), 21:49, 25/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Еще в коллекцию?

    https://www.altlinux.org/OCR

     
  • 1.33, Ю.Т. (?), 08:26, 26/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Тессеракт имеет "нейронки" уже лет 10 почти.

    Со "смесью языков" он работает, возможно, не блестяще, но и не плохо.

    Китайский в нём есть, и "новый", и "старый".

    Работать нужно, понятно же, с лучшим набором:
    github.com/tesseract-ocr/tessdata_best

    Чего не хватает тессеракту -
    1 никак не родят к нему путёвый разбиватель страницы. Собственный там старый и довольно упрощённый.
    2 Семантика текста, выражаемая размерами, положениями и начертаниями (выделения,дроби, индексы, сноски), не обрабатывается.
    3 Их обучающие наборы данных скромноваты по размерам (не забудем, конечно, что их собирают и раздают бесплатно)
    4 Также реализованная в тессеракте модель машобучения не позволяет её удобно доообучить.

     
     
  • 2.36, tkzv (ok), 10:14, 26/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    > Со "смесью языков" он работает, возможно, не блестяще, но и не плохо.

    Прикрутить бы LanguageTool какой-нибудь. Чтобы меньше путал "не" и "he".

    > 1 никак не родят к нему путёвый разбиватель страницы. Собственный там старый и довольно упрощённый.

    Сейчас проще руками разбить картинку на несколько, чем надеяться, что распознает колонки.

    > 2 Семантика текста, выражаемая размерами, положениями и начертаниями (выделения,дроби,  индексы, сноски), не обрабатывается.

    Вообще какая-нибудь программа это умеет?

    > 4 Также реализованная в тессеракте модель машобучения не позволяет её удобно доообучить.

    Если я правильно понял документацию, обучение медленное и не умеет пользоваться GPU.

    От себя добавлю внезапные затыки, когда в упор не видит не очень контрастный текст, но при изменении гаммы в любую сторону прекрасно всё распознаёт. И очень плохо распознаёт, если на черно-белом скриншоте что-то подчёркнуто или обведено красным.


     
     
  • 3.37, Ю.Т. (?), 12:09, 26/04/2026 [^] [^^] [^^^] [ответить]  
  • +/
    > Прикрутить бы LanguageTool какой-нибудь. Чтобы меньше путал "не" и "he".

    Думаю, такие действия лучше бы получать из мета-описаний. "Текст содержит целые слова в разных системах письма", а отсюда и вариант: "В тексте просто есть римские числа".

    То же и к разбивателю относится. Глаз-мозг у всех одинаковы (с точки зрения такой задачи), так что не так много и сценариев выкладки (лучше сказать -- признаков?).

    > Вообще какая-нибудь программа это умеет?

    Кажется, нет. Но это как бы и не задача распознавалки, скорее - для средств постобработки.

    Да, разноцветный текст тессеракт не любит. Но там и предобработка - оочень скупая.

     

  • 1.38, Сладкая булочка (?), 18:12, 26/04/2026 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Госопода, подскажите, он же с формулами так и не научился работать? Что посоветуете для распознавания формул?
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2026 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру