Home   Artículos   Recursos   Foros   
Artíclos recientes publicados en Latindevelopers:

Visual C++: NSDoubleEdit: Un control para el manejo de números decimales en Visual C++.
Visual C++: Implementando una Calculadora en Visual C++
Visual C++: CCommandLine: Una clase para el uso de la linea de comando
Visual C++: Una clase para el manejo del Registro


SIMILITUD DE DOCUMENTOS

Forte For Java, JavaBeens, JBuilder, JDK compiladores, Applets, Proyectos Web, interactividad con JDBC... entre mucho mas.
Moderador

Moderador: iuav

SIMILITUD DE DOCUMENTOS

Notapor rapunzel el Vie Oct 12, 2007 7:35 pm

hola, estoy trabando con estructuras de datos y ahora quiero hacer un programa que me sirva para detectar si un documento es plagio, yo anteriormente he trabajado con imagenes es decir buscando por similitud en un vtp lo que ahora quiero saber para trabajar con texto es como se hace la comparacion porque cuando trabajaba con imagnes las vectorizaba y ya tenia la imagen en un vector de numeros asi era facil comparar pero ¿como hago con texto o documentos?.

gracias espero que me ayuden
rapunzel
Novato
Novato
 
Mensajes: 1
Registrado: Vie Oct 12, 2007 7:20 pm

Re: SIMILITUD DE DOCUMENTOS

Notapor ivancp el Sab Oct 13, 2007 11:33 am

Una opcion es que almacenes las palabras y les des un peso a cada una, el peso puede ser el "significado", luego guardas estos valores en algun sitio con el objeto de buscar un patron.

Al abrir otro documento puedes hacer lo mismo. Al momento de comparar los patrones notarás similitudes.

Bueno, hay muchas investigaciones que implementan lo que tu necesitas... es cuestion de que busques papers al respecto:

http://dc.exa.unrc.edu.ar/wicc/papers/Algoritmos/91.ps
ivancp
Programador Experimentado
Programador Experimentado
 
Mensajes: 371
Registrado: Jue Sep 06, 2007 12:57 pm


Volver a Java

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 0 invitados