← Volver a las guías

Cómo copiar texto de una imagen o captura de pantalla al instante

Ahorra tiempo transcribiendo datos, apuntes y correos incrustados usando el reconocimiento óptico de caracteres (OCR) local.


Resumen
• La transcripción manual es una pérdida de tiempo cuando un modelo OCR puede extraer 500 palabras por segundo.
• Usar Tesseract JS permite extraer los caracteres directamente dentro de la pestaña de tu navegador, garantizando privacidad total.
• Funciona de maravilla en capturas de pantalla o facturas escaneadas con buena iluminación.

Deja de transcribir todo a mano

A menudo recibes una tarjeta de presentación fotografiada, un meme con un texto gracioso o un documento PDF escaneado donde no se puede seleccionar el texto. En estos casos, la técnica del Reconocimiento Óptico de Caracteres (OCR) hace magia. Puedes leer más acerca de la historia del reconocimiento en el Proyecto Tesseract. Desbloquea esas palabras utilizando el módulo de extraer texto. Si la foto está ladeada y el texto está en diagonal, te recomendamos que primero uses rotar imagen para alinearla.

El reconocimiento es infinitamente superior cuando el contraste entre la letra y el fondo es fuerte. Si mandas una foto de un papel blanco fotografiado en la sombra, la precisión bajará del 99% al 85%.

Guía rápida de escaneo

Recupera el contenido escrito en pocos clics.

  1. Consigue una foto clara del texto. Si has hecho una captura rápida y se ve mucha basura alrededor, puedes usar recortar imagen para centrarte solo en el párrafo.
  2. Sube la foto al sistema de OCR y selecciona el idioma del texto (inglés, español, etc.) para que cargue el diccionario correcto.
  3. Espera unos segundos mientras el motor analiza las líneas y letras.
  4. Copia el texto plano resultante al portapapeles. Si luego necesitas convertir esa foto en un PDF junto a otras notas, usa Imagen a PDF.
Tasa de Precisión OCR según origen (2026) Captura de Pantalla Digital (Fuente de PC) 99.8% Documento Escaneado (Blanco/Negro) 98.5% Fotografía móvil (Mal iluminada / Papel curvo) 84.0%
Fuente: Tesseract JS Benchmarks, 2026

Problemas comunes durante la lectura

Tipo de ErrorCausa ProbableSolución recomendada
Letras "l" confundidas por "1" o "I"Baja resoluciónAmpliar la imagen original primero
Palabras sin sentidoIdioma equivocado seleccionadoRe-seleccionar el diccionario (ej: pasar a Español)
Textos curvos o doblados ignoradosDistorsión geométrica de la cámaraAplanar el libro y tomar la foto de forma perpendicular

Preguntas Frecuentes

¿Puede leer escritura a mano (manuscritos)?

La precisión baja drásticamente. El motor está fuertemente entrenado en tipografías digitales estándar (Times New Roman, Arial, Roboto). Cierta letra cursiva extremadamente clara y prolija puede ser detectada, pero es mejor usar el OCR solo para letras de molde.

¿Qué ocurre si el texto tiene fondos de colores detrás?

Los algoritmos OCR de última generación utilizan un proceso previo llamado binarización, donde intentan forzar todos los colores oscuros a ser negros y los claros a ser blancos. Funciona bastante bien, pero fallará si el color del texto y del fondo es muy similar (poco contraste).

Imagen a texto (OCR) →