What kind of OCR Java library should I use in Android? [closed]

Какую библиотеку OCR Java мне следует использовать в Android?

Я хотел бы создать приложение для Android, которое с помощью библиотеки OCR должно сканировать изображение, извлекая из него текст.

Какую библиотеку Java я должен использовать?

Переведено автоматически

Ответ 1

Не знаю, насколько она хороша (ее определенно нужно сначала обучить), но есть библиотека Java OCR Рона Кемера.

Ответ 2

Если вы ищете очень расширяемый вариант или у вас есть конкретная проблемная область, вы могли бы рассмотреть возможность создания собственной, используя Java Object Oriented Neural Engine.

Я успешно использовал ее в личном проекте для идентификации буквы по изображению, такому как это, вы можете найти все исходные тексты для компонента OCR моего приложения на github, здесь.

Ответ 3

попробуйте tesseract, ознакомьтесь с этой статьей http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html и этим примером http://code.google.com/p/mezzofanti /

Редактировать: еще несколько фактов - tesseract - один из лучших OCR с открытым исходным кодом, используемых Google - доступны обучающие данные для многих языков - mezzofanti - это приложение для Android, использующее tesseract - осторожно: OCR использует много мощности процессора. попытка распознать страницу формата A4 с помощью вашего T-Mob G1 займет много времени, и результат может вас не впечатлить ;-)

Ответ 4

Вы можете использовать функцию распознавания текста из документов Google. Проверьте API данных списка документов http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR

2023-10-09 05:05 java android