🖼️ ¿Cómo extraer texto de imágenes? | Python-tesseract | PDF2IMAGE | OCR | Python

Sdílet
Vložit
  • čas přidán 6. 09. 2024

Komentáře • 63

  • @cctmexico
    @cctmexico  Před 4 lety +9

    ⏰ Por si tienes prisa, aquí te dejamos el minuto a minuto del vídeo:
    0:35 Extraer texto de una imagen, a partir de una captura de pantalla de un PDF y de un JPG
    8:30 Convertir cada hoja de un pdf a imagen
    11:59 A partir de cada imagen extraer el texto y agregarlo a un archivo txt
    17:50 Revisión de los archivos (Resultado de la corrida)

  • @edicando9941
    @edicando9941 Před 2 lety +1

    Buen video muy interesante al ejecutar este programa jajajaj 6:55 como no reconocer a la chilindrina saludos y bendiciones desde Ecuador *EC*

  • @Tarahuma
    @Tarahuma Před rokem +1

    Genial el tutorial, en mi caso tenía varías imágenes con listas de texto, que debía pasarlas a texto; estuvo genial!!

  • @OsmioGonzalez
    @OsmioGonzalez Před 4 lety +1

    Impactante la potencia del módulo presentado, Gracias por el video

  • @TzMarko1001
    @TzMarko1001 Před 3 lety +1

    Gracias a tus videos empecé amar Python. Muchas gracias de todo corazón :D

    • @cctmexico
      @cctmexico  Před 3 lety

      ¡Nos da mucho gusto saber que los vídeos te fueron de utilidad! Muchísimas gracias a tí, por dejar tan amable comentario y ¡Por vernos!

  • @adolfofloreslimon2076
    @adolfofloreslimon2076 Před 2 lety +1

    muchas gracias por este magnifico aporte!!! Que Dios le bendiga

  • @RonBastidas
    @RonBastidas Před 4 lety +1

    Muy feliz de ver tus esfuerzos en la divulgación de la ciencia y tecnología Enhorabuena y Felicidades desde Naucalpan

    • @cctmexico
      @cctmexico  Před 4 lety

      ¡Muchas gracias por tan bonito comentario, ^_^ y por vernos, muchos saludos hasta el querido Naucalpan !

  • @1Revolucion1
    @1Revolucion1 Před 4 lety +1

    Buen video, buen dato, yo lo que haría es crear un poco más de código al inicio para que el usuario pueda agregar cualquier imagen en lugar de que tenga que modificar el código, lo que haría el user es arrastrar el archivo a la consola. Saludos desde Colombia ✌️😎 me suscribo.

    • @cctmexico
      @cctmexico  Před 4 lety +1

      ¡Exclente idea! Muchos saludos hasta las hermosas tierras Colombianas!

  • @leonardomolina8958
    @leonardomolina8958 Před 4 lety +2

    Muchas gracias! Muy interesante el potencial de las herramientas al ir uniéndolas. A la espera de los próximos tutoriales. Ojalá pudieran sacar algunos de algebra linean en sus secciones de matemáticas.

    • @cctmexico
      @cctmexico  Před 4 lety

      ¡Muchas gracias por tan amable comentario, con gusto lo anotamos como #petición!

  • @robotvivo5158
    @robotvivo5158 Před 4 lety +1

    Que Hermoso canal. Y tu le das luz.

  • @patriciocardenas9724
    @patriciocardenas9724 Před 4 lety +1

    Grande La Chilindrina....
    Y que bien explica profe!!

    • @cctmexico
      @cctmexico  Před 4 lety +1

      Así es! :) Muy bien por la Chilindrina, y muchas gracias por tan amable comentario!

  • @daniivcgamer9597
    @daniivcgamer9597 Před 3 lety +1

    El vídeo está muy bien explicado, me ayudó bastante, muchas gracias de verdad!

  • @MiguelLeon-tw2ii
    @MiguelLeon-tw2ii Před 3 lety +1

    Excelente video, me sirvio de mucho gracias por tu tiempo y esfuerzo para facilitarnos las cosas

  • @alfonsonavarrete4284
    @alfonsonavarrete4284 Před 4 lety

    Muchas gracias Liliana, tus vídeos me han parecido excelentes.

  • @jmdelgado2001
    @jmdelgado2001 Před 3 lety +1

    Excelente muchas gracias por el tutorial

  • @franciscojavierruizoliva5437

    Excelente video, muchas gracias, puedes extraer solo algo de texto, ejemplo pudieras extraer solo el título ?

  • @worez17
    @worez17 Před 4 lety +1

    hola he tenido problemas para instalar el modulo de pdf2image, como de que otra forma puedo agregarlo?

  • @armandojoseacostajulio1562

    Un saludo cordial desde Cartagena Colombia, felicitaciones por tan buenos aportes, me gustaría saber si pueden colaborar con un video tutorial sobre como escanear documentos usando python, ya que seria de gran ayuda.

    • @cctmexico
      @cctmexico  Před 4 lety

      ¡Muchas gracias por tan amable comentario, con gusto lo anotamos como #petición!

  • @cursoderobotica
    @cursoderobotica Před 4 lety +1

    genial!!!! un saludo 😊👋🏼

    • @cctmexico
      @cctmexico  Před 4 lety

      ¡Muchas gracias por tan bonito comentario, ^_^ y por vernos, muchos saludos!

  • @jric1831
    @jric1831 Před 2 lety

    Thanks, you're pro

  • @pabloarizono8398
    @pabloarizono8398 Před rokem

    se podra hace con la camara? es decir en vez de subir un archivo, mejor activar la camara del movil o pc?

  • @MegaLobo000
    @MegaLobo000 Před 4 lety

    Hola Excelente como siempre. Disculpa, en el caso que tenga un video. Puedo procesar de la misma manera. Saludos

  • @miguelaristizabal4996
    @miguelaristizabal4996 Před 4 lety +2

    Excelente video
    No puedo hacerlo porque me sale este error
    TesseractNotFoundError: C:\Users\XUE\Documents\PYTHON\EJERCICIOS PROPIOS\Tesseract-OCR\tesseract.exe is not installed or it's not in your path
    Qué debo hacer
    Mil gracias

    • @miguelaristizabal4996
      @miguelaristizabal4996 Před 4 lety +3

      Ya lo solucioné
      Si a alguien se le presenta dejo el link con los pasos
      stackoverflow.com/questions/50951955/pytesseract-tesseractnotfound-error-tesseract-is-not-installed-or-its-not-i
      Tienen que poner cuidado con la ruta en c:/ en donce se les instale el tesseract

    • @cctmexico
      @cctmexico  Před 4 lety

      ¡Excelente, nos da mucho gusto saberlo, muchas gracias por vernos!

  • @Peter-cs9eu
    @Peter-cs9eu Před 4 lety +1

    Muy buen video y bien explicado, por que cambiaste de spyder a pycharm?

    • @cctmexico
      @cctmexico  Před 4 lety

      ¡Muchas gracias por tan amable comentario! En una actualización Spyder se nos desconfiguró, comenzamos a utilizar Pycharm y nos gustó mucho!

  • @syasusan3011
    @syasusan3011 Před 4 lety +1

    Muy bueno tus videos gracias por compartir, en este caso no tuve problemas con los 2 primeros ejemplos pero si con el ultimo cuando tienes 2 páginas. " FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado
    ...... During handling of the above exception, another exception occurred:" y el otro error FiPDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH?

    • @cctmexico
      @cctmexico  Před 4 lety

      Hola, muchas gracias por tan amable comentario! Desconocemos la respuesta, si nos encontramos con esa información con gusto se las compartimos, saludos!

  • @geodatacenter
    @geodatacenter Před 4 lety +1

    Hola les felicito desde ya por los videos. Una consulta que software debo teber y como se configura para tener pandas numpy scilab matploit etc en Windows. Por otro lado como puedo obtener datos de varias columnas de varios rchivos en una carpeta?

    • @cctmexico
      @cctmexico  Před 4 lety

      Con Google colab no es necesario instalar en la computadora algún software en especial, aquí dejo unos vídeos que también tienen el tema de leer datos de columnas:
      czcams.com/video/QJpE90cEaP0/video.html

  • @alvaroalfonso8754
    @alvaroalfonso8754 Před 4 lety +1

    👍

  • @sonodinamite
    @sonodinamite Před 3 lety +1

    Hola!
    Gracias por compartir,
    ¿Solo es posible ejecutar Tesseract mediante pycharm?

    • @cctmexico
      @cctmexico  Před 3 lety +1

      En cualquier software que use Python (o página de Internet como Google colab) lo puedes ejecutar :)

    • @sonodinamite
      @sonodinamite Před 3 lety

      @@cctmexico Excelente, por ejemplo, spyder de anaconda? Quiero procesar PDF's con texto e imagen.

  • @davidmartinez-ie5ig
    @davidmartinez-ie5ig Před rokem

    Hola buen dia me aparece el error de Image no esta definido? me ayudasw con la solución gracias

  • @ravtepdav
    @ravtepdav Před 3 lety

    cuales son los caracteres que es capaz de reconocer?

  • @franciscojaviersanchezhere5513

    Hola fijate que lo estoy ejecutando en pycharm, otra molestia fijate que me marca ModuleNotFoundError: No module named 'pytesseract', serias tan amable de decirme que debo hacer?, disculpa es mi primer programa en Python

    • @cctmexico
      @cctmexico  Před 3 lety

      Si el módulo no se encuentra como dice el error, es porque no está instalado, o pudiera haber un error de dedo, y hay un error en la escritura del módulo.
      Aquí te dejamos un vídeo que te puede ser de utilidad, para interpretar los errores de Python: czcams.com/video/X46F2-OxxqY/video.html

  • @user-ff5jn2mm7j
    @user-ff5jn2mm7j Před 3 lety

    Hola, existe alguna posibilidad de hacer un contador de estas palabras extraidas?
    Gracias

  • @franciscojaviersanchezhere5513

    Hola disculpa en que editas el programa?

    • @cctmexico
      @cctmexico  Před 3 lety

      Hola, puede ser con Spyder: www.spyder-ide.org/
      Con pycharm: www.jetbrains.com/pycharm/
      Y si no quieres instalar nada en tu computadora y lo quieres hacer desde línea, lo puedes hacer con Google Colab, en este vídeo lo utilizamos: czcams.com/video/AteqQ9pmhB0/video.html

  • @geodatacenter
    @geodatacenter Před 4 lety +1

    Bueno pero con imagenes con texto manuscrito???

    • @cctmexico
      @cctmexico  Před 4 lety

      Lo vamos a probar :D Se los dejamos como post, el resultado

  • @vulkano77
    @vulkano77 Před 3 lety

    Tengo las librerias instaladas, el codigo correctamente copiado y solo me sale este error...
    NameError: name 'Image' is not defined

    • @cctmexico
      @cctmexico  Před 3 lety

      Probablemente el archivo tenga otro nombre o haya un error muy sencillo al teclear alguna instrucción, aquí dejamos un vídeo para interpretar y resolver errores básicos de Python: czcams.com/video/X46F2-OxxqY/video.html

    • @agusfranzante
      @agusfranzante Před 3 lety

      132
      You could try using Pillow instead, which is a PIL fork:
      pip install Pillow
      To import use:
      from PIL import Image

  •  Před 4 lety

    no me hace el reconocimiento de texto de la imagen, uso python 3.8, la conversion de pdf a jpg si se pudo realizar, me sale este mensaje al final del error: pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path

    • @leonardomolina8958
      @leonardomolina8958 Před 4 lety +1

      instalaste tesseract ??

    •  Před 4 lety

      @@leonardomolina8958 so lo instalé, por eso mi interrogante, será por la versión de Python 64bits?

    • @9009luki
      @9009luki Před 4 lety +1

      @ pytesseract.pytesseract.tesseract_cmd = "C:\\Program Files\\Tesseract-OCR\\tesseract.exe"

  • @igs6181
    @igs6181 Před 4 lety

    que version de python usó?

  • @TheGrevall
    @TheGrevall Před 4 lety

    Tienen cuenta en los LinkedIn?

    • @cctmexico
      @cctmexico  Před 4 lety

      Hola Grevall, no :)

    • @TheGrevall
      @TheGrevall Před 4 lety

      @@cctmexico te recomiendo que lo hagas, es una gran plataforma profesional, y tu tienes buen material didáctico, Puedes expandirte un poco más por ese medio.