SIMILITUD DE DOCUMENTOS

Moderador: iuav

Temas relacionados: Java, JavaBeens, JBuilder, JDK, Applets, etc

SIMILITUD DE DOCUMENTOS

Notapor rapunzel » Vie Oct 12, 2007 7:35 pm

hola, estoy trabando con estructuras de datos y ahora quiero hacer un programa que me sirva para detectar si un documento es plagio, yo anteriormente he trabajado con imagenes es decir buscando por similitud en un vtp lo que ahora quiero saber para trabajar con texto es como se hace la comparacion porque cuando trabajaba con imagnes las vectorizaba y ya tenia la imagen en un vector de numeros asi era facil comparar pero ¿como hago con texto o documentos?.

gracias espero que me ayuden
rapunzel
Novato
Novato
 
Mensajes: 1
Registrado: Vie Oct 12, 2007 7:20 pm


Re: SIMILITUD DE DOCUMENTOS

Notapor ivancp » Sab Oct 13, 2007 11:33 am

Una opcion es que almacenes las palabras y les des un peso a cada una, el peso puede ser el "significado", luego guardas estos valores en algun sitio con el objeto de buscar un patron.

Al abrir otro documento puedes hacer lo mismo. Al momento de comparar los patrones notarás similitudes.

Bueno, hay muchas investigaciones que implementan lo que tu necesitas... es cuestion de que busques papers al respecto:

http://dc.exa.unrc.edu.ar/wicc/papers/Algoritmos/91.ps
Avatar de Usuario
ivancp
Colaborador
Colaborador
 
Mensajes: 680
Registrado: Jue Sep 06, 2007 12:58 pm



    

Volver a Java

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 0 invitados