Tesis de Pedro Sánchez

Sólo diez minutos para 342 páginas

Sólo diez minutos para 342 páginaslarazon

Juan Scaliter

Creada: 15.09.2018 03:03

Última actualización: 15.09.2018 03:03

La palabra plagio, de raíz latina, tiene su origen en la práctica de usar un esclavo ajeno como propio. Desde aquellos tiempos hemos evolucionado mucho...en algunos aspectos. Pero el plagio sigue existiendo y, gracias a internet, cada vez más. La disponibilidad de contenido, en varios idiomas, la mejora en los traductores online y la creación constante de nueva información, hace que la red sea un océano casi infinito en cuanto a pesca de información. De acuerdo con un estudio de un estudio de IBM Marketing Cloud, el 90% de los datos en Internet se han creado desde 2016. Estamos hablando de más de 50 billones (sí, con b) de páginas. Y la tentación en este sentido es enorme, quizás tanta como la coincidencia de ideas ya que, si bien no hay nada nuevo bajo el Sol, rara vez, ocurren los milagros de la originalidad.

Por ello es tan determinante poder señalar cuándo un contenido creado, ya sea para una editorial o para una universidad, es original o sufre de «plagiaritis».

La tecnología es un aliado vital, pero hay que dejar claro que ningún software de detección de plagio identifica esta práctica ni siquiera su intención, algo fundamental a la hora de evaluar el contenido por parte de quienes los reciben. En un sentido muy básico, un software especializado es como un motor de búsquedas en la red, que se dedica a señalar coincidencias.

Los programas informáticos trabajan en cuatro estratos diferentes, uno más profundo que el otro.

Desde Turnitin afirman que analizar un documento como la tesis de Pedro Sánchez toma entre 5 y 10 minutos en pasar los resultados. El sistema tiene una base muy importante de fuentes en contenido online, unas 87.000 millones. En una primera instancia el sistema puede buscar palabras claves, como cuando realizamos una búsqueda en Google. Sistemas como Turnitin escanean una enorme base de datos (cercana a los 100.000 millones) para encontrar coincidencias. Y no lo hace en la web en general, sino en artículos científicos, publicaciones especializadas y documentos universitarios, entre otros. Es una suerte de primer ensayo.

Si quiere mayor profundidad se puede analizar la similitud de grupos de palabras o frases. Estas dos primeras alternativas son muy útiles para identificar copias casi exactas y casos flagrantes de plagio. Pero adolecen de la capacidad de cazar a quienes se han tomado el trabajo de reconstruir un texto mediante sinónimos y cambios en el orden.

Para estos casos están las instancias más profundas. Una es analizar el estilo de la escritura y compararlo con otros documentos. Si los programas anteriores eran como buscadores, estos funcionan como el sistema predictivo en los móviles, solo que en lugar de sugerirnos palabras, estudian una frase y predicen la posibilidad de plagio de acuerdo a la siguiente.

Finalmente, se puede utilizar lo que llamaríamos la huella dactilar del autor, algo así como la pincelada de ciertos artistas que nos permiten identificar su obra. Precisamente Turnitin, utiliza una tecnología propia que le permite escanear e identificar tanto los fragmentos únicos como su orden para crear la huella de cada documento y usarlo como testigo. Pero, ¿qué ocurre cuando el documento está en otro idioma?

«Nuestro sistema reconoce cualquier lenguaje –nos explica Lluis Val, responsable de Turnitin en la península Ibérica–, al analizar las letras, independientemente del alfabeto, podemos cotejarlas con palabras. Si se identifican ciertas coincidencias, el sistema usa nuevas alertas para profundizar más. A día de hoy se está trabajando en una solución robusta a nivel interlenguaje. Actualmente garantizamos que el contenido se va a cotejar con la base de datos en inglés, que a nivel global constituye el 70%. Y se está trabajando para que esta base sea igual de fiable en español–ruso, ruso–checo y checo–italiano. En total, tenemos unos 15 idiomas».