⏰ Por si tienes prisa, aquí te dejamos el minuto a minuto del vídeo: 0:35 Extraer texto de una imagen, a partir de una captura de pantalla de un PDF y de un JPG 8:30 Convertir cada hoja de un pdf a imagen 11:59 A partir de cada imagen extraer el texto y agregarlo a un archivo txt 17:50 Revisión de los archivos (Resultado de la corrida)
Buen video, buen dato, yo lo que haría es crear un poco más de código al inicio para que el usuario pueda agregar cualquier imagen en lugar de que tenga que modificar el código, lo que haría el user es arrastrar el archivo a la consola. Saludos desde Colombia ✌️😎 me suscribo.
Muchas gracias! Muy interesante el potencial de las herramientas al ir uniéndolas. A la espera de los próximos tutoriales. Ojalá pudieran sacar algunos de algebra linean en sus secciones de matemáticas.
Un saludo cordial desde Cartagena Colombia, felicitaciones por tan buenos aportes, me gustaría saber si pueden colaborar con un video tutorial sobre como escanear documentos usando python, ya que seria de gran ayuda.
Excelente video No puedo hacerlo porque me sale este error TesseractNotFoundError: C:\Users\XUE\Documents\PYTHON\EJERCICIOS PROPIOS\Tesseract-OCR\tesseract.exe is not installed or it's not in your path Qué debo hacer Mil gracias
Ya lo solucioné Si a alguien se le presenta dejo el link con los pasos stackoverflow.com/questions/50951955/pytesseract-tesseractnotfound-error-tesseract-is-not-installed-or-its-not-i Tienen que poner cuidado con la ruta en c:/ en donce se les instale el tesseract
Muy bueno tus videos gracias por compartir, en este caso no tuve problemas con los 2 primeros ejemplos pero si con el ultimo cuando tienes 2 páginas. " FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado ...... During handling of the above exception, another exception occurred:" y el otro error FiPDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH?
Hola, muchas gracias por tan amable comentario! Desconocemos la respuesta, si nos encontramos con esa información con gusto se las compartimos, saludos!
Hola les felicito desde ya por los videos. Una consulta que software debo teber y como se configura para tener pandas numpy scilab matploit etc en Windows. Por otro lado como puedo obtener datos de varias columnas de varios rchivos en una carpeta?
Con Google colab no es necesario instalar en la computadora algún software en especial, aquí dejo unos vídeos que también tienen el tema de leer datos de columnas: czcams.com/video/QJpE90cEaP0/video.html
Hola fijate que lo estoy ejecutando en pycharm, otra molestia fijate que me marca ModuleNotFoundError: No module named 'pytesseract', serias tan amable de decirme que debo hacer?, disculpa es mi primer programa en Python
Si el módulo no se encuentra como dice el error, es porque no está instalado, o pudiera haber un error de dedo, y hay un error en la escritura del módulo. Aquí te dejamos un vídeo que te puede ser de utilidad, para interpretar los errores de Python: czcams.com/video/X46F2-OxxqY/video.html
Hola, puede ser con Spyder: www.spyder-ide.org/ Con pycharm: www.jetbrains.com/pycharm/ Y si no quieres instalar nada en tu computadora y lo quieres hacer desde línea, lo puedes hacer con Google Colab, en este vídeo lo utilizamos: czcams.com/video/AteqQ9pmhB0/video.html
Probablemente el archivo tenga otro nombre o haya un error muy sencillo al teclear alguna instrucción, aquí dejamos un vídeo para interpretar y resolver errores básicos de Python: czcams.com/video/X46F2-OxxqY/video.html
132 You could try using Pillow instead, which is a PIL fork: pip install Pillow To import use: from PIL import Image
Před 4 lety
no me hace el reconocimiento de texto de la imagen, uso python 3.8, la conversion de pdf a jpg si se pudo realizar, me sale este mensaje al final del error: pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
@@cctmexico te recomiendo que lo hagas, es una gran plataforma profesional, y tu tienes buen material didáctico, Puedes expandirte un poco más por ese medio.
⏰ Por si tienes prisa, aquí te dejamos el minuto a minuto del vídeo:
0:35 Extraer texto de una imagen, a partir de una captura de pantalla de un PDF y de un JPG
8:30 Convertir cada hoja de un pdf a imagen
11:59 A partir de cada imagen extraer el texto y agregarlo a un archivo txt
17:50 Revisión de los archivos (Resultado de la corrida)
Buen video muy interesante al ejecutar este programa jajajaj 6:55 como no reconocer a la chilindrina saludos y bendiciones desde Ecuador *EC*
Genial el tutorial, en mi caso tenía varías imágenes con listas de texto, que debía pasarlas a texto; estuvo genial!!
Impactante la potencia del módulo presentado, Gracias por el video
Gracias a tus videos empecé amar Python. Muchas gracias de todo corazón :D
¡Nos da mucho gusto saber que los vídeos te fueron de utilidad! Muchísimas gracias a tí, por dejar tan amable comentario y ¡Por vernos!
muchas gracias por este magnifico aporte!!! Que Dios le bendiga
Muy feliz de ver tus esfuerzos en la divulgación de la ciencia y tecnología Enhorabuena y Felicidades desde Naucalpan
¡Muchas gracias por tan bonito comentario, ^_^ y por vernos, muchos saludos hasta el querido Naucalpan !
Buen video, buen dato, yo lo que haría es crear un poco más de código al inicio para que el usuario pueda agregar cualquier imagen en lugar de que tenga que modificar el código, lo que haría el user es arrastrar el archivo a la consola. Saludos desde Colombia ✌️😎 me suscribo.
¡Exclente idea! Muchos saludos hasta las hermosas tierras Colombianas!
Muchas gracias! Muy interesante el potencial de las herramientas al ir uniéndolas. A la espera de los próximos tutoriales. Ojalá pudieran sacar algunos de algebra linean en sus secciones de matemáticas.
¡Muchas gracias por tan amable comentario, con gusto lo anotamos como #petición!
Que Hermoso canal. Y tu le das luz.
Grande La Chilindrina....
Y que bien explica profe!!
Así es! :) Muy bien por la Chilindrina, y muchas gracias por tan amable comentario!
El vídeo está muy bien explicado, me ayudó bastante, muchas gracias de verdad!
Excelente video, me sirvio de mucho gracias por tu tiempo y esfuerzo para facilitarnos las cosas
Muchas gracias Liliana, tus vídeos me han parecido excelentes.
Excelente muchas gracias por el tutorial
Excelente video, muchas gracias, puedes extraer solo algo de texto, ejemplo pudieras extraer solo el título ?
hola he tenido problemas para instalar el modulo de pdf2image, como de que otra forma puedo agregarlo?
Un saludo cordial desde Cartagena Colombia, felicitaciones por tan buenos aportes, me gustaría saber si pueden colaborar con un video tutorial sobre como escanear documentos usando python, ya que seria de gran ayuda.
¡Muchas gracias por tan amable comentario, con gusto lo anotamos como #petición!
genial!!!! un saludo 😊👋🏼
¡Muchas gracias por tan bonito comentario, ^_^ y por vernos, muchos saludos!
Thanks, you're pro
se podra hace con la camara? es decir en vez de subir un archivo, mejor activar la camara del movil o pc?
Hola Excelente como siempre. Disculpa, en el caso que tenga un video. Puedo procesar de la misma manera. Saludos
Excelente video
No puedo hacerlo porque me sale este error
TesseractNotFoundError: C:\Users\XUE\Documents\PYTHON\EJERCICIOS PROPIOS\Tesseract-OCR\tesseract.exe is not installed or it's not in your path
Qué debo hacer
Mil gracias
Ya lo solucioné
Si a alguien se le presenta dejo el link con los pasos
stackoverflow.com/questions/50951955/pytesseract-tesseractnotfound-error-tesseract-is-not-installed-or-its-not-i
Tienen que poner cuidado con la ruta en c:/ en donce se les instale el tesseract
¡Excelente, nos da mucho gusto saberlo, muchas gracias por vernos!
Muy buen video y bien explicado, por que cambiaste de spyder a pycharm?
¡Muchas gracias por tan amable comentario! En una actualización Spyder se nos desconfiguró, comenzamos a utilizar Pycharm y nos gustó mucho!
Muy bueno tus videos gracias por compartir, en este caso no tuve problemas con los 2 primeros ejemplos pero si con el ultimo cuando tienes 2 páginas. " FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado
...... During handling of the above exception, another exception occurred:" y el otro error FiPDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH?
Hola, muchas gracias por tan amable comentario! Desconocemos la respuesta, si nos encontramos con esa información con gusto se las compartimos, saludos!
Hola les felicito desde ya por los videos. Una consulta que software debo teber y como se configura para tener pandas numpy scilab matploit etc en Windows. Por otro lado como puedo obtener datos de varias columnas de varios rchivos en una carpeta?
Con Google colab no es necesario instalar en la computadora algún software en especial, aquí dejo unos vídeos que también tienen el tema de leer datos de columnas:
czcams.com/video/QJpE90cEaP0/video.html
👍
Hola!
Gracias por compartir,
¿Solo es posible ejecutar Tesseract mediante pycharm?
En cualquier software que use Python (o página de Internet como Google colab) lo puedes ejecutar :)
@@cctmexico Excelente, por ejemplo, spyder de anaconda? Quiero procesar PDF's con texto e imagen.
Hola buen dia me aparece el error de Image no esta definido? me ayudasw con la solución gracias
cuales son los caracteres que es capaz de reconocer?
Hola fijate que lo estoy ejecutando en pycharm, otra molestia fijate que me marca ModuleNotFoundError: No module named 'pytesseract', serias tan amable de decirme que debo hacer?, disculpa es mi primer programa en Python
Si el módulo no se encuentra como dice el error, es porque no está instalado, o pudiera haber un error de dedo, y hay un error en la escritura del módulo.
Aquí te dejamos un vídeo que te puede ser de utilidad, para interpretar los errores de Python: czcams.com/video/X46F2-OxxqY/video.html
Hola, existe alguna posibilidad de hacer un contador de estas palabras extraidas?
Gracias
Hola disculpa en que editas el programa?
Hola, puede ser con Spyder: www.spyder-ide.org/
Con pycharm: www.jetbrains.com/pycharm/
Y si no quieres instalar nada en tu computadora y lo quieres hacer desde línea, lo puedes hacer con Google Colab, en este vídeo lo utilizamos: czcams.com/video/AteqQ9pmhB0/video.html
Bueno pero con imagenes con texto manuscrito???
Lo vamos a probar :D Se los dejamos como post, el resultado
Tengo las librerias instaladas, el codigo correctamente copiado y solo me sale este error...
NameError: name 'Image' is not defined
Probablemente el archivo tenga otro nombre o haya un error muy sencillo al teclear alguna instrucción, aquí dejamos un vídeo para interpretar y resolver errores básicos de Python: czcams.com/video/X46F2-OxxqY/video.html
132
You could try using Pillow instead, which is a PIL fork:
pip install Pillow
To import use:
from PIL import Image
no me hace el reconocimiento de texto de la imagen, uso python 3.8, la conversion de pdf a jpg si se pudo realizar, me sale este mensaje al final del error: pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
instalaste tesseract ??
@@leonardomolina8958 so lo instalé, por eso mi interrogante, será por la versión de Python 64bits?
@ pytesseract.pytesseract.tesseract_cmd = "C:\\Program Files\\Tesseract-OCR\\tesseract.exe"
que version de python usó?
Python 3, saludos!
Tienen cuenta en los LinkedIn?
Hola Grevall, no :)
@@cctmexico te recomiendo que lo hagas, es una gran plataforma profesional, y tu tienes buen material didáctico, Puedes expandirte un poco más por ese medio.