🔎 Как отсканировать текст в python и преобразовать его в цифры за несколько шагов
import pytesseract
from PIL import Image
# Открываем изображение
image = Image.open('путь_к_изображению')
# Используем pytesseract для сканирования текста
scanned_text = pytesseract.image_to_string(image, lang='rus')
# Выводим результат
print(scanned_text)
Детальный ответ
Как отсканировать текст в Python
Отсканировать текст в Python можно с помощью библиотеки pytesseract. pytesseract — это обёртка Python над OCR- движком Tesseract, разработанным Google. Он позволяет распознавать текст из изображений и сканированных документов.
Установка pytesseract
Для начала необходимо установить pytesseract и Tesseract OCR на вашей системе.
!pip install pytesseract
!apt-get install tesseract-ocr
Пример использования
import pytesseract
from PIL import Image
# Загрузка изображения
image = Image.open('example.png')
# Извлечение текста
text = pytesseract.image_to_string(image, lang='rus')
# Вывод текста
print(text)
Объяснение примера
В этом примере мы:
- Импортируем библиотеку pytesseract и модуль Image из PIL (Pillow).
- Загружаем изображение, на котором содержится текст, с помощью функции Image.open(). Замените 'example.png' на путь к вашему изображению.
- Используем функцию pytesseract.image_to_string() для распознавания текста на изображении. Устанавливаем параметр lang='rus', чтобы указать, что текст находится на русском языке.
- Выводим распознанный текст с помощью функции print().
Убедитесь, что у вас установлены все необходимые зависимости, и ваше изображение доступно по указанному пути.
Дополнительные параметры pytesseract.image_to_string()
Функция pytesseract.image_to_string() имеет несколько дополнительных параметров, которые могут быть полезными:
- config: Позволяет настроить параметры Tesseract OCR, такие как распознавание языка, использование словарей и т. д. Подробная документация по параметрам конфигурации доступна на официальном сайте Tesseract OCR.
- boxes: Если установлено значение True, функция вернет список координат прямоугольников, ограничивающих каждый распознанный символ. Это может быть полезно, если вам нужно извлечь дополнительную информацию о распознанных символах.
- output_type: Указывает формат вывода распознанного текста. Значениями могут быть 'string' (по умолчанию), 'dict', 'bytes' или 'df'.
Вывод
Теперь вы знаете, как отсканировать текст в Python с помощью библиотеки pytesseract. Помните, что результаты могут зависеть от качества изображения и языка текста. Экспериментируйте с различными настройками и параметрами, чтобы получить наилучшие результаты.