Если вы ищете очень расширяемый вариант или у вас есть конкретная проблемная область, вы могли бы рассмотреть возможность создания собственной, используя Java Object Oriented Neural Engine.
Я успешно использовал ее в личном проекте для идентификации буквы по изображению, такому как это, вы можете найти все исходные тексты для компонента OCR моего приложения на github, здесь.
Редактировать: еще несколько фактов - tesseract - один из лучших OCR с открытым исходным кодом, используемых Google - доступны обучающие данные для многих языков - mezzofanti - это приложение для Android, использующее tesseract - осторожно: OCR использует много мощности процессора. попытка распознать страницу формата A4 с помощью вашего T-Mob G1 займет много времени, и результат может вас не впечатлить ;-)