Home   Artículos   Recursos   Foros   
Artíclos recientes publicados en Latindevelopers:
Visual C++: NSDoubleEdit: Un control para el manejo de números decimales en Visual C++.
Visual C++: Implementando una Calculadora en Visual C++
Visual C++: CCommandLine: Una clase para el uso de la linea de comando
Visual C++: Una clase para el manejo del Registro

algoritmo coseno de similaridad

Aqui encontras... Listas Dinámicas (COLA, PILA), con Enlace Unico, y Enlace Doble, Arboles binarios, B+, B*, AVL, y sus aplicaciones...

algoritmo coseno de similaridad

Notapor madsiro el Jue Feb 07, 2008 7:32 pm

Hola, tengo que implementar una aplicacion que me compare dos documentos, tengo q hacer un crawler y estoy en la parte de comparar entre los documentos web y lo voy a hacer por el contenido de las paginas, he buscado acerca de eso y he encontrado el algoritmo coseno de similaridad, pero mi problema es que la informacion que he encontrado no la entiendo bien, explican las formulas del algoritmo, pero no se por donde empezar para implementarlo, lo voy a hacer en c++, por favor alguien que me pueda ayudar a entender bien acerca de su implementacion, gracias y saludos cordiales.
madsiro
Novato
Novato
 
Mensajes: 7
Registrado: Vie Nov 23, 2007 6:17 pm

Re: algoritmo coseno de similaridad

Notapor JuanNoldin el Mar Feb 12, 2008 9:31 am

mmmm Por el contenido de la página... bueno se me ocurre que uses el cod fuente de cada página, donde puedes al valor asscii de cada caracter multiplicado x un valor de ordinalidad asignado dependiendo de donde aparezca cada caracter, asi cada página o cada texo, al final, dara como resultado un número q dificilmente se vuelva a repetir,si usas solo números primos para la ordinalidad. <----puede ser mejorado. Saludos
JuanNoldin
Novato
Novato
 
Mensajes: 2
Registrado: Mar Feb 12, 2008 8:49 am


Volver a Algoritmos y Estructuras de datos

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 0 invitados