🖼️ ¿Cómo extraer texto de imágenes? | Python-tesseract | PDF2IMAGE | OCR | Python

cctmexico

zhlédnutí 15 041

Přidat do
- Můj playlist
- Přehrát později
Sdílet

Sdílet

Vložit

Velikost videa:

Zobrazit ovladače přehrávání

Automatické přehrávání

Přehrát

čas přidán 6. 09. 2024

Komentáře • 63

@cctmexico Před 4 lety ⁺⁹
⏰ Por si tienes prisa, aquí te dejamos el minuto a minuto del vídeo:
0:35 Extraer texto de una imagen, a partir de una captura de pantalla de un PDF y de un JPG
8:30 Convertir cada hoja de un pdf a imagen
11:59 A partir de cada imagen extraer el texto y agregarlo a un archivo txt
17:50 Revisión de los archivos (Resultado de la corrida)
@edicando9941 Před 2 lety ⁺¹
Buen video muy interesante al ejecutar este programa jajajaj 6:55 como no reconocer a la chilindrina saludos y bendiciones desde Ecuador *EC*
@Tarahuma Před rokem ⁺¹
Genial el tutorial, en mi caso tenía varías imágenes con listas de texto, que debía pasarlas a texto; estuvo genial!!
@OsmioGonzalez Před 4 lety ⁺¹
Impactante la potencia del módulo presentado, Gracias por el video
@TzMarko1001 Před 3 lety ⁺¹
Gracias a tus videos empecé amar Python. Muchas gracias de todo corazón :D
@cctmexico Před 3 lety
¡Nos da mucho gusto saber que los vídeos te fueron de utilidad! Muchísimas gracias a tí, por dejar tan amable comentario y ¡Por vernos!
@adolfofloreslimon2076 Před 2 lety ⁺¹
muchas gracias por este magnifico aporte!!! Que Dios le bendiga
@RonBastidas Před 4 lety ⁺¹
Muy feliz de ver tus esfuerzos en la divulgación de la ciencia y tecnología Enhorabuena y Felicidades desde Naucalpan
@cctmexico Před 4 lety
¡Muchas gracias por tan bonito comentario, ^_^ y por vernos, muchos saludos hasta el querido Naucalpan !
@1Revolucion1 Před 4 lety ⁺¹
Buen video, buen dato, yo lo que haría es crear un poco más de código al inicio para que el usuario pueda agregar cualquier imagen en lugar de que tenga que modificar el código, lo que haría el user es arrastrar el archivo a la consola. Saludos desde Colombia ✌️😎 me suscribo.
@cctmexico Před 4 lety ⁺¹
¡Exclente idea! Muchos saludos hasta las hermosas tierras Colombianas!
@leonardomolina8958 Před 4 lety ⁺²
Muchas gracias! Muy interesante el potencial de las herramientas al ir uniéndolas. A la espera de los próximos tutoriales. Ojalá pudieran sacar algunos de algebra linean en sus secciones de matemáticas.
@cctmexico Před 4 lety
¡Muchas gracias por tan amable comentario, con gusto lo anotamos como #petición!
@robotvivo5158 Před 4 lety ⁺¹
Que Hermoso canal. Y tu le das luz.
@patriciocardenas9724 Před 4 lety ⁺¹
Grande La Chilindrina....
Y que bien explica profe!!
@cctmexico Před 4 lety ⁺¹
Así es! :) Muy bien por la Chilindrina, y muchas gracias por tan amable comentario!
@daniivcgamer9597 Před 3 lety ⁺¹
El vídeo está muy bien explicado, me ayudó bastante, muchas gracias de verdad!
@MiguelLeon-tw2ii Před 3 lety ⁺¹
Excelente video, me sirvio de mucho gracias por tu tiempo y esfuerzo para facilitarnos las cosas
@alfonsonavarrete4284 Před 4 lety
Muchas gracias Liliana, tus vídeos me han parecido excelentes.
@jmdelgado2001 Před 3 lety ⁺¹
Excelente muchas gracias por el tutorial
@franciscojavierruizoliva5437 Před 2 lety
Excelente video, muchas gracias, puedes extraer solo algo de texto, ejemplo pudieras extraer solo el título ?
@worez17 Před 4 lety ⁺¹
hola he tenido problemas para instalar el modulo de pdf2image, como de que otra forma puedo agregarlo?
@armandojoseacostajulio1562 Před 4 lety ⁺¹
Un saludo cordial desde Cartagena Colombia, felicitaciones por tan buenos aportes, me gustaría saber si pueden colaborar con un video tutorial sobre como escanear documentos usando python, ya que seria de gran ayuda.
@cctmexico Před 4 lety
¡Muchas gracias por tan amable comentario, con gusto lo anotamos como #petición!
@cursoderobotica Před 4 lety ⁺¹
genial!!!! un saludo 😊👋🏼
@cctmexico Před 4 lety
¡Muchas gracias por tan bonito comentario, ^_^ y por vernos, muchos saludos!
@jric1831 Před 2 lety
Thanks, you're pro
@pabloarizono8398 Před rokem
se podra hace con la camara? es decir en vez de subir un archivo, mejor activar la camara del movil o pc?
@MegaLobo000 Před 4 lety
Hola Excelente como siempre. Disculpa, en el caso que tenga un video. Puedo procesar de la misma manera. Saludos
@miguelaristizabal4996 Před 4 lety ⁺²
Excelente video
No puedo hacerlo porque me sale este error
TesseractNotFoundError: C:\Users\XUE\Documents\PYTHON\EJERCICIOS PROPIOS\Tesseract-OCR\tesseract.exe is not installed or it's not in your path
Qué debo hacer
Mil gracias
@miguelaristizabal4996 Před 4 lety ⁺³
Ya lo solucioné
Si a alguien se le presenta dejo el link con los pasos
stackoverflow.com/questions/50951955/pytesseract-tesseractnotfound-error-tesseract-is-not-installed-or-its-not-i
Tienen que poner cuidado con la ruta en c:/ en donce se les instale el tesseract
@cctmexico Před 4 lety
¡Excelente, nos da mucho gusto saberlo, muchas gracias por vernos!
@Peter-cs9eu Před 4 lety ⁺¹
Muy buen video y bien explicado, por que cambiaste de spyder a pycharm?
@cctmexico Před 4 lety
¡Muchas gracias por tan amable comentario! En una actualización Spyder se nos desconfiguró, comenzamos a utilizar Pycharm y nos gustó mucho!
@syasusan3011 Před 4 lety ⁺¹
Muy bueno tus videos gracias por compartir, en este caso no tuve problemas con los 2 primeros ejemplos pero si con el ultimo cuando tienes 2 páginas. " FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado
...... During handling of the above exception, another exception occurred:" y el otro error FiPDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH?
@cctmexico Před 4 lety
Hola, muchas gracias por tan amable comentario! Desconocemos la respuesta, si nos encontramos con esa información con gusto se las compartimos, saludos!
@geodatacenter Před 4 lety ⁺¹
Hola les felicito desde ya por los videos. Una consulta que software debo teber y como se configura para tener pandas numpy scilab matploit etc en Windows. Por otro lado como puedo obtener datos de varias columnas de varios rchivos en una carpeta?
@cctmexico Před 4 lety
Con Google colab no es necesario instalar en la computadora algún software en especial, aquí dejo unos vídeos que también tienen el tema de leer datos de columnas:
czcams.com/video/QJpE90cEaP0/video.html
@alvaroalfonso8754 Před 4 lety ⁺¹
👍
@sonodinamite Před 3 lety ⁺¹
Hola!
Gracias por compartir,
¿Solo es posible ejecutar Tesseract mediante pycharm?
@cctmexico Před 3 lety ⁺¹
En cualquier software que use Python (o página de Internet como Google colab) lo puedes ejecutar :)
@sonodinamite Před 3 lety
@@cctmexico Excelente, por ejemplo, spyder de anaconda? Quiero procesar PDF's con texto e imagen.
@davidmartinez-ie5ig Před rokem
Hola buen dia me aparece el error de Image no esta definido? me ayudasw con la solución gracias
@ravtepdav Před 3 lety
cuales son los caracteres que es capaz de reconocer?
@franciscojaviersanchezhere5513 Před 3 lety
Hola fijate que lo estoy ejecutando en pycharm, otra molestia fijate que me marca ModuleNotFoundError: No module named 'pytesseract', serias tan amable de decirme que debo hacer?, disculpa es mi primer programa en Python
@cctmexico Před 3 lety
Si el módulo no se encuentra como dice el error, es porque no está instalado, o pudiera haber un error de dedo, y hay un error en la escritura del módulo.
Aquí te dejamos un vídeo que te puede ser de utilidad, para interpretar los errores de Python: czcams.com/video/X46F2-OxxqY/video.html
@user-ff5jn2mm7j Před 3 lety
Hola, existe alguna posibilidad de hacer un contador de estas palabras extraidas?
Gracias
@franciscojaviersanchezhere5513 Před 3 lety
Hola disculpa en que editas el programa?
@cctmexico Před 3 lety
Hola, puede ser con Spyder: www.spyder-ide.org/
Con pycharm: www.jetbrains.com/pycharm/
Y si no quieres instalar nada en tu computadora y lo quieres hacer desde línea, lo puedes hacer con Google Colab, en este vídeo lo utilizamos: czcams.com/video/AteqQ9pmhB0/video.html
@geodatacenter Před 4 lety ⁺¹
Bueno pero con imagenes con texto manuscrito???
@cctmexico Před 4 lety
Lo vamos a probar :D Se los dejamos como post, el resultado
@vulkano77 Před 3 lety
Tengo las librerias instaladas, el codigo correctamente copiado y solo me sale este error...
NameError: name 'Image' is not defined
@cctmexico Před 3 lety
Probablemente el archivo tenga otro nombre o haya un error muy sencillo al teclear alguna instrucción, aquí dejamos un vídeo para interpretar y resolver errores básicos de Python: czcams.com/video/X46F2-OxxqY/video.html
@agusfranzante Před 3 lety
132
You could try using Pillow instead, which is a PIL fork:
pip install Pillow
To import use:
from PIL import Image
Před 4 lety
no me hace el reconocimiento de texto de la imagen, uso python 3.8, la conversion de pdf a jpg si se pudo realizar, me sale este mensaje al final del error: pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
@leonardomolina8958 Před 4 lety ⁺¹
instalaste tesseract ??
Před 4 lety
@@leonardomolina8958 so lo instalé, por eso mi interrogante, será por la versión de Python 64bits?
@9009luki Před 4 lety ⁺¹
@ pytesseract.pytesseract.tesseract_cmd = "C:\\Program Files\\Tesseract-OCR\\tesseract.exe"
@igs6181 Před 4 lety
que version de python usó?
@cctmexico Před 4 lety
Python 3, saludos!
@TheGrevall Před 4 lety
Tienen cuenta en los LinkedIn?
@cctmexico Před 4 lety
Hola Grevall, no :)
@TheGrevall Před 4 lety
@@cctmexico te recomiendo que lo hagas, es una gran plataforma profesional, y tu tienes buen material didáctico, Puedes expandirte un poco más por ese medio.

Další v pořadí

Automatické přehrávání

DON'T THROW AWAY your Broken TV without Watching This Video First!