El Etiquetador De Canciones

PFC y otras chorradas

Empezando 5 marzo 2009

Bueno, despues de investigar un poco ya voy teniendo algo que hacer :).

Aquí va la guía fundamental de las cosas que tengo que hacer:

1.- Crear la base de datos en MySQL,pero antes resolver algunas dudas respecto a ella (etiquetas temporales…). En ella se guardarán todas y cada una de las etiquetas que el servidor busque por peticiones de la aplicación. Habrá que diferenciar de algun modo las que sean revisadas por una persona y las que no, pues el algoritmo de búsqueda podrá fallar.

2.-Hacer una aplicación en PHP, que se comunique con la base de datos anterior, e implentar alguno de los algoritmos para buscar las etiquetas que no estén en la base de datos en internet.

3.-Hacer la aplicación en sí en Adobe AIR, que se encargará de recoger la información disponible de cada álbum/canción, comunicarse con el servidor que tendrá la aplicación en PHP y esperar a que éste le devuelva las etiquetas correctas, de forma que la aplicación las modificará y mostrará la información al usuario, además de permitirle reproducir las canciones.

Lo más difícil sin duda es el paso 2, los algoritmos de búsqueda, que es realmente lo que yo quiero que sea mi proyecto, pues de ellos depende que esto sea un éxito o un fracaso.

El mayor problema de las etiquetas es encontrar las de los recopilatorios, las de grupos y solistas seguramente se puedan obtener de MusicBrainz (http://musicbrainz.org/) o algún otro, pero los recopilatorios recientes no están recogidos allí. Así que investigando encontré que toda esa información de los recopilatorios se encuentra en páginas de intercambio de p2p. Hasta ahora he estado sacando conclusiones de Mininova.org, y parece que la mayoría de los recopilatorios incluyen la lista de canciones (tracklist), y que todos incluyen la misma información delimitada por separadores:

(pista <separador> artista <separador> titulo

Por ejemplo: la busqueda de VA-Superventas.2009 (así es el nombre de la carpeta en mi ordenador) nos dá como resultado esto: http://www.mininova.org/tor/2262086

Como vemos se separan incluso los cds, y cada canción mantiene el formato arriba especificado, incluyendo en este caso el tiempo (con sus correspondientes delimitadores []).

El algoritmo para esta página sería, pues, para cada línea, coger la información obviando los separadores, y guardar cada cosa en su sitio: el primer campo en una variable ‘pista’, el segundo en una variable ‘artista’ y el ultimo en una variable ‘titulo’. A parte hay que adaptar el algoritmo para que llegue a la zona de la página en donde está toda esta información, y que descarte todo lo que no nos sea de utilidad, como pueden ser comentarios u otras cosas irrelevantes para nuestro programa

Para comunicar FLEX con PHP creo que utilizaré Zend Framework, pues es lo que encontré que permite esto y lo desarrollan los propios desarrolladores de PHP. Habrá que instalar Apache y MySql también.

Un saludo!

Anuncios
 

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s