Распознавание текста с картинки. Python Tesseract ORC + OpenCV

  Рет қаралды 63,859

Гоша Дударь

Гоша Дударь

Күн бұрын

Как распознать текст с фото? За счет языка Python и библиотеки OpenCV + Tesseract ORC это можно сделать за несколько строк кода. За урок мы разработаем систему для считывания данных из любого фото.
🚀 🚀 🚀
Ссылка на бесплатный интенсив «Как выбрать направление ИИ» от GeekBrains: geekbrains.ru/link/_oOuMN
🚀 🚀 🚀
✅ Полезные ссылки:
🏛 Плейлист по нейронным сетям: • Изучение нейронных сет...
✏️ Официальный сайт Tesseract: tesseract-ocr.github.io/tessd...
📺 Tesseract для Windows: tesseract-ocr.github.io/tessd...
🔑 Языки для Tesseract: tesseract-ocr.github.io/tessd...
✏️ Статья с кодом: itproger.com/news/raspoznavan...
🕰 Тайм-коды:
00:00 - Начало
00:30 - Что мы сделаем за урок?
01:19 - Установка библиотеки
02:19 - Создание проекта
03:03 - Работа с OpenCV
04:45 - Считывание данных
05:35 - Формирование надписей
07:07 - Заключительная часть
✔ Сообщество программистов: itproger.com/
✔ -------------
Вступай в группу Вк - prog_life 🚀
Группа FaceBook - goo.gl/XW0aaP
Инстаграм itProger: / itproger_official
Instagram: / gosha_dudar
Telegram: t.me/itProger_official
Twitter - / goshadudar
- Уроки от #GoshaDudar 👨🏼‍💻
- Все уроки по хештегу #goshaLessons

Пікірлер: 102
@user-gd6dm2xp1p
@user-gd6dm2xp1p 3 жыл бұрын
Нету файла для скачивания pytesseract ocr на сайте пишет что нет актуальной версии для установки что делать?
@hornylucenro666
@hornylucenro666 3 жыл бұрын
Круто новое видео от Гоши)
@blwashere
@blwashere 3 жыл бұрын
можно поступить проще: в терминале(cmd) установить pip и написать: pip install tesseract
@musa_usmanov
@musa_usmanov 3 жыл бұрын
pip install opencv-python
@blwashere
@blwashere 3 жыл бұрын
@@musa_usmanov Так тоже ожно)
@timofey-0307
@timofey-0307 Жыл бұрын
Это не так работает. Нужно проинсталлировать библиотеку + установить tesseract на компьютер
@user-lu8vw1ud1f
@user-lu8vw1ud1f 3 жыл бұрын
Спасибо все супер. Скажи можно ли из js передать картинку в питон который обрабатывает фото и результат отдаёт назад в js?
@43oiurtjkn9gfds8y98r
@43oiurtjkn9gfds8y98r 3 жыл бұрын
Спасибо
@user-gs6of5vv6r
@user-gs6of5vv6r 3 жыл бұрын
Сделай курс по data science на python или про ИИ на python. В крайнем случае про нейросеть.
@user-lm6ch4zi7y
@user-lm6ch4zi7y 3 жыл бұрын
Спасибо.
@gennady3935
@gennady3935 3 жыл бұрын
Может кто подсказать, в AWS Textract можно написать price и он выведет только стоимость если она указана, т.е. сопоставляет данные и выводит именно тот текст, который нам нужен. В tesseract есть такое?
@gooddo1852
@gooddo1852 3 жыл бұрын
Ты супер! Продолдай в томже духе
@olzhasshabdenov3362
@olzhasshabdenov3362 3 жыл бұрын
Гоша, красавчег👍
@msmesh5666
@msmesh5666 3 жыл бұрын
Это даже не он сделал - kzfaq.info/get/bejne/bKqaedaUvZqtj5c.html
@user-it8bb2zb5q
@user-it8bb2zb5q 3 жыл бұрын
ого круто.
@konstantin9888
@konstantin9888 3 жыл бұрын
Гоша. скинь пжл ссылки на репозиторий, тех программ которые ты использовал в качестве примера при работе с OpenCV
@YanchikDev
@YanchikDev 3 жыл бұрын
Жду видео про template matching
@TblKBA_Z
@TblKBA_Z 2 жыл бұрын
помогите пж, нужно создавать скрины определённой области, загружать их в скрипт, находить символы и их-же писать (как send в ahk, не в командную строку)
@kirill_bykov
@kirill_bykov 3 жыл бұрын
6:02 ну зачем? Делается слайс [1:] и всё.
@MrFog124
@MrFog124 3 жыл бұрын
Давай видос по считыванию потокового видео с программы и распознавании собственных объектов
@user-hp1xs6jp4z
@user-hp1xs6jp4z 2 жыл бұрын
Того файла на сайте нету про Tesseract
@dictatorsupreme5447
@dictatorsupreme5447 3 жыл бұрын
Гоша, сделай пожалуйста видео на тему Перенос HTML сайта на WordPress ?
@XEROS282
@XEROS282 2 жыл бұрын
А как сканировать баркоды через Django?
@konstbespr619
@konstbespr619 3 жыл бұрын
Гоша, сделай пожалуйста видео на тему интеграции оплаты в телеграм бота! Нигде нет инфы на эту тему
@Cloudy-zq5yx
@Cloudy-zq5yx 3 жыл бұрын
Есть.
@konstbespr619
@konstbespr619 3 жыл бұрын
@@Cloudy-zq5yx линк?
@Cloudy-zq5yx
@Cloudy-zq5yx 3 жыл бұрын
​@@konstbespr619 physics is simple aiogram набери
@MrDlop
@MrDlop 3 жыл бұрын
Может там как в ВК боте?
@MrDlop
@MrDlop 3 жыл бұрын
Я просто не помню, давно этим не интересовался
@villainmadless1503
@villainmadless1503 3 жыл бұрын
OCR же, OCR!
@user-uu9wg1yj2t
@user-uu9wg1yj2t 2 жыл бұрын
а можно с нескольких картинок собирать данные в Excel
@sergozar
@sergozar 3 жыл бұрын
А как распознать символы типо "·ê ·Ë· »ê ³ ·³¼ ·Ë"?
@casuale1200
@casuale1200 3 жыл бұрын
круть
@zemf4you731
@zemf4you731 3 жыл бұрын
Параметры запуска тессеракта абсолютно не за то отвечают, что ты сказал. Oem - способ распознавания, psm (page segmentation mode) - режим сегментации страницы (в основном тессеракт с документами работает, при выщове помощи можно просмотреть все режимы сегментации) Вместо enumerate и проверку индекса можно было сделать срез, так как нам всё равно необходимо будет хранить считанные данные в памяти, нет смысла пытаться сохратить итератор
@amidl
@amidl 2 жыл бұрын
Больше всего меня удивило, что автор использует аббревиатуру ORC, хотя общепринятой является OCR (о чем автор даже в названии библиотеки мог увидеть).
@diasoralbekov6465
@diasoralbekov6465 3 жыл бұрын
где ссылка на виндовс инсталер
@baukaalimgazy2989
@baukaalimgazy2989 3 жыл бұрын
Круто, у меня вчера была идея сделать комментатор бота ВК с искусственным интеллектом который считывает данные с поста и пишет наиболее подходящий коммент и через определенное время проверять сколько лайков набралось и в зависимости от кол-ва лайков менять веса и другие параметры нейросети, но я конечно же отказался от этой идеи, так как не знал считывать текст с картинки и множество других проблем, вот и решена одна проблема, если другие тоже сами по себе решатся, то может сделаю)
@NeuralAIM
@NeuralAIM 3 жыл бұрын
Зачем тебе тогда нейросеть? Парсер странички нужен для получения данных, так быстрее, точнее и менее ресурсозатратнее. Не быть тебе программистом) И уж даже если ты и накодишь нейронку (Даже через тот же tensor) то тебе этого не хватит (Она все равно будет тупой, сколько бы ты данных не вливал) А данных для обучения нужно больше чем пару тысяч фраз...
@puturoi
@puturoi 3 жыл бұрын
судя по твоему комменту, не особо ты сечешь, как работает нс, бот и т.д. Чтобы считать текст из поста вообще нвхрен не нужен computervision c tesseractom.
@baukaalimgazy2989
@baukaalimgazy2989 3 жыл бұрын
@@NeuralAIM лол нейросеть из видео нужен, чтобы разпознать текст из картинок, а в ВК большинство постов в виде картинки. И я написал в комменте что ещё много заморочек кроме этого, но для генерации комментария GMT2 или 3, который может генерировать текст или статью а не то что коммент, просто если ему дать тему. Или можно ещё что то самому придумать.
@baukaalimgazy2989
@baukaalimgazy2989 3 жыл бұрын
@@puturoi лол, я же написал в "ВК", в ВК много постов в виде картинки, и там текст в картинке и либа с этого видео только для того что распознать текст с постов в виде картинки. И я ещё я дополнил что много проблем кроме распознавания текстов и ТД. И я хоть и практический не делал нормальные проекты с нейросетями, но знаю как сделать перцептрон и обратное распространение ошибки, и знаю какие ограничения у вк, у официального или у неофициальных VK API для бота и с ними тоже работал, делал разных ботов ВК
@stoparb357
@stoparb357 3 жыл бұрын
@@baukaalimgazy2989 а, ты тип хочешь быть самым первым комментатором под постами чи шо
@user-tj4we7hk9d
@user-tj4we7hk9d 3 жыл бұрын
Уху питон 🐍
@VladKochetov
@VladKochetov 3 жыл бұрын
@Гоша Дударь, попробуй сделать урок по numba
@user-ps9rp7bp3t
@user-ps9rp7bp3t 3 жыл бұрын
Ребят подскажите что делать вылазит вот эта ошибка img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) cv2.error: OpenCV(4.4.0) /private/var/folders/nz/vv4_9tw56nv9k3tkvyszvwg80000gn/T/pip-req-build-2rx9f0ng/opencv/modules/imgproc/src/color.cpp:182: error: (-215:Assertion failed) !_src.empty() in function 'cvtColor'
@hinomuratomisaburo4901
@hinomuratomisaburo4901 3 жыл бұрын
фотку название файла обрежь коротким название сделай типо temp.png
@user-ps9rp7bp3t
@user-ps9rp7bp3t 3 жыл бұрын
@@hinomuratomisaburo4901 не получилось
@imperria392
@imperria392 2 жыл бұрын
тоже самое, ты если понял как это сделать скажи мне пожалуйста
@imperria392
@imperria392 2 жыл бұрын
вообщем я понял, там к нему нужно путь написать
@user-gd6dm2xp1p
@user-gd6dm2xp1p 3 жыл бұрын
Гошаааа видео супер но у меня проблема. Тесеракт поставился а вот с opencv проблемы. При написании просто в терминале пайчарма через pip выдаёт ошибку. Проблема с логами. Я не особо сведующий в логировании да и вообще в программировании. Прошу помощи либо у тебя либо друзья подписчики подскажите что сделать чтобы установить opencv. Заранее спасибо
@drfclub777
@drfclub777 Жыл бұрын
получилось?
@sunmaxplay6491
@sunmaxplay6491 3 жыл бұрын
как быть с 4 строчкой на линуксе?
@Crd51409
@Crd51409 3 жыл бұрын
Не нужна
@CalmVideo
@CalmVideo 3 жыл бұрын
Всё конечно очень круто, но до того, чтобы понять, мне далековато. :) Хочу тоже этому научиться (создавать нейросети), но пока чёт не очень получается, но ничего!
@rustc2p256
@rustc2p256 3 жыл бұрын
Для начало изучи основы
@CalmVideo
@CalmVideo 3 жыл бұрын
@@rustc2p256 , стараюсь.
@kirillusenko
@kirillusenko 3 жыл бұрын
Это сложно, но вот курс по которому я пытался изучать tensorflow: kzfaq.info/sun/PLtPJ9lKvJ4oiz9aaL_xcZd-x0qd8G0VN_
@CalmVideo
@CalmVideo 3 жыл бұрын
@@kirillusenko , спасибо!
@zaralx
@zaralx 3 жыл бұрын
Блен ты прям вот во время как раз пишу прошу для бота в игре
@shadowcode7752
@shadowcode7752 3 жыл бұрын
Запишы курс по rust.
@stariy_bog
@stariy_bog 3 жыл бұрын
Как сделать что бы распознавал русский текст ?
@the..egoisto
@the..egoisto 3 жыл бұрын
Он же сказал что надо выбрать при загрузке и русский
@stariy_bog
@stariy_bog 3 жыл бұрын
@@the..egoisto скачал а где подключить Подключаю после конфига выдает ошибку
@Dikobrother
@Dikobrother 3 жыл бұрын
@@stariy_bog Там где конфиг он подключал пишешь , lang='rus'. Перед эти закидываешь файл с языком в папку tessdata с самим тессерактом
@user-eq5dp5lj5t
@user-eq5dp5lj5t 3 жыл бұрын
Когда будет видио про создания игр?
@User-S05
@User-S05 3 жыл бұрын
У него этих видео жопой ешь
@user-lq6ey5cz3c
@user-lq6ey5cz3c 3 жыл бұрын
А она может комбинировать языки? К примеру код естественно написан на английском языке ,но у него есть комментарии на русском.
@mikelieber7256
@mikelieber7256 3 жыл бұрын
Да, можно. На C#, если воспользоваться библиотекой для тессеракта, ты можешь при инициализации тессеракта указать, например, RUS+ENG, но качество OCR будет чуть ниже.
@dmitriy2502
@dmitriy2502 2 жыл бұрын
Здравствуйте! А подскажите, можно ли этим методом распознавать цифры из потока видео? Например спортивное электронное табло с временем, время минуты +секунды?
@unknown_youtube_user
@unknown_youtube_user 2 жыл бұрын
Метод показанный в видео работает с картинками, если ты разработаешь программу которая будет делать скриншоты и вставлять для считывания, то вполне возможно.
@DictorDialog
@DictorDialog Жыл бұрын
Всё это будет работать пока фон под текстом не будет пёстрым
@Lucerbius
@Lucerbius 7 ай бұрын
ОэрСи, боже, чувак не может три буквы OCR прочитать в правильном порядке... А по уроку выпадает ошибка: cv2.error: OpenCV(4.8.1) D:\a\opencv-python\opencv-python\opencv\modules\highgui\src\window.cpp:1272: error: (-2:Unspecified error) The function is not implemented. Rebuild the library with Windows, GTK+ 2.x or Cocoa support. If you are on Ubuntu or Debian, install libgtk2.0-dev and pkg-config, then re-run cmake or configure script in function 'cvShowImage'
@L3M-carx
@L3M-carx 2 ай бұрын
А ты не лучше, почитать ошибку можешь а не в комы вставлять. Переустанови библиотеку блять умник
@qwer5822
@qwer5822 3 жыл бұрын
Видео о том как взломать чужой компьютер - kzfaq.info/get/bejne/jtp9mqiXyMDLiqM.html
@a1exlovser136
@a1exlovser136 3 жыл бұрын
digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.02-20180621.exe возможно вот этот файл нужный
@KuKuRuuZa
@KuKuRuuZa 2 жыл бұрын
И не ORC а правильно OCR
@sergeisuslov773
@sergeisuslov773 9 ай бұрын
Сами же говорите оптикал кхеректал рекгнишн, а потом аббревиатура меняет порядок символов на о-эр-си, когда на самом деле оно о-си-ар
@irgendwer234
@irgendwer234 3 жыл бұрын
Cnacubo
@wad_code
@wad_code 3 жыл бұрын
Начал с ORC закончит RAC
@nikolaydd6219
@nikolaydd6219 3 жыл бұрын
Но ведь не удобно работать с Питоном, гораздо удобней было бы сделать программу с интерфейсом, окном и кнопками .
@nikolaydd6219
@nikolaydd6219 3 жыл бұрын
Тесеракт довольно хреновое решение. Сам им пользуюсь и проблем с ним - полно. Хорошее решение это Yandex Vision, но капец какой дорогой.
@yes_ss
@yes_ss Жыл бұрын
PermissionError: [WinError 5] Отказано в доступе
@pirozhekN
@pirozhekN 3 жыл бұрын
Тессеракт орк
@dedpihto680
@dedpihto680 Жыл бұрын
из 7 минутного видео полторы минуты реклама и никчемное вступление, потом еще и посреди ролика впихнул рекламу. топчик
@PythononPapyrusRU
@PythononPapyrusRU 3 жыл бұрын
Круто! Неужели ты не любишь его😭😭??? Я про Python. А если и любишь, то почему не подписан на мой канал? Исправь это🤙😎
@User-S05
@User-S05 3 жыл бұрын
У тебя как то разрозненно всё. Я не очень люблю питухон, но могу сказать, что нужно тебе делать видео более подробные по нему. Расскажи про всё что знаешь. Smtplib, json, datetime, request, tkinter, socket, os, time. Сними самую подробную серию видео по питухону на рутубе и я думаю добьёш 1млн подписчиков к весне 21!!!
@pavelkross
@pavelkross 3 жыл бұрын
даешь тоже самое только на C#!!
@user-st9hk2pp3o
@user-st9hk2pp3o 3 жыл бұрын
Плохо работает с русским языком.
@tarantinPipka
@tarantinPipka 2 ай бұрын
твои видео все до единого не рабочие , не заработало не чего .. хз , я уже скоко их не смотрел.. вродь пробелма в опен сиви ... она у твоему коде кривая ..щас комент вставлю что пиет джипити
@tarantinPipka
@tarantinPipka 2 ай бұрын
Кажется, возникла проблема с библиотекой OpenCV, которая используется для отображения изображений. Ошибка указывает на то, что функция cv2.imshow() не реализована. Это может быть вызвано неправильной установкой или версией OpenCV. Попробуйте переустановить OpenCV или обновить его до последней версии. Возможно, вам также потребуется установить зависимости для поддержки графического интерфейса, если вы используете его на Windows.
@user-qi1hs7jb6t
@user-qi1hs7jb6t 2 жыл бұрын
Мой коммент будет явно удален, но что я хочу сказать: Гоша, тебе простительно что ты не ученый в сфере компьютерного зрения и машинного обучения. Но готовься пожалуйста лучше. Многая терминология неточна или неверная + про функции питона немного неверно говоришь)
@user-jn3ll7ho7q
@user-jn3ll7ho7q 2 жыл бұрын
дохлый движок он распознает с кракозябрами.. это капитализм.. хорошие движки платные.. тоже с говорилками...про браузеры вообще молчу.. по моему нам слили чтобы началась гражданская война до того раздражает тупизм некоторого ПО ..вместо нормального функционала команд в консоли приходится лезть черт знает куда...
OpenCV. #2 Распознавание цветных объектов
7:36
Паяльник TV
Рет қаралды 27 М.
ЧУТЬ НЕ УТОНУЛ #shorts
00:27
Паша Осадчий
Рет қаралды 10 МЛН
Fast and Furious: New Zealand 🚗
00:29
How Ridiculous
Рет қаралды 37 МЛН
Каха заблудился в горах
00:57
К-Media
Рет қаралды 8 МЛН
Why Is He Unhappy…?
00:26
Alan Chikin Chow
Рет қаралды 33 МЛН
Python OpenCV и цвета ▲ Как я создавал бота для Diablo 2
8:18
Чёрный Треугольник
Рет қаралды 39 М.
Налог на незнание JavaScript - [Hamster Kombat]
50:20
Как в 44 года стать программистом на Python. Объясняю с чего начать.
19:32
ЧУТЬ НЕ УТОНУЛ #shorts
00:27
Паша Осадчий
Рет қаралды 10 МЛН