Programme TV de Belgique en XML : comment j’ai fait ?

Suite à quelques demandes, je vais vous expliquer comment j’ai réussi à obtenir ceci : https://vinch.be//tv

La page sur laquelle je vais chercher le contenu est celle-ci : http://cinetelerevue.tvbase.net. Cette page est pour moi relativement moche et le code source (en syntaxe HTML 4) est très chargé et non valide.

Ma première étape a été de transformer le code source de cette page en XHTML valide. Je réalise cela grâce au service Tidy du W3C et j’obtiens comme résultat : http://cgi.w3.org/cgi-bin/tidy?docAddr=http://cinetelerevue.tvbase.net&indent=on&forceXML=on

Comme ce que j’obtiens est du XML valide (XHTML), je peux le transformer en un autre fichier XML (où je garde uniquement ce qui m’intéresse) grâce à une feuille de style XSLT écrite par mes soins. Cela donne le résultat final : https://vinch.be//tv.

Voilà, ce n’était pas plus compliqué que ça !

4 Comments

  1. Unknown's avatar xof says:

    tiens?!,

    c’est cassé… (21dec2006)

    Je m’étais servi du fichier .xml pour faire un test d’interface (CSS+Javascript) pour voir ce que cela donnerait de pouvoir sélectionner un type de programme instantanément et de fournir des informations complémentaires en survolant le programme…

    On pourrait poursuivre l’expérience en fournissant une fiche complète avec un click ou mettre une photo dans l’info-bulle, etc…

    Mais, le gros problème, c’est d’avoir une source fiable (et légale) de tout les programmes en .XML. Pirater CineTéléRevue (même en reconnaissant le crédit), n’est pas vraiment la solution la plus élégante…

    Aujourd’hui 21dec2006, cela ne semble pas avoir fonctionné. Dommage.

    Sinon, c’est une bonne idée de fournir le programme en .XML.

    —-
    users.skynet.be/chricat/p…

    Like

  2. Vinch's avatar Vinch says:

    Oui il semble y avoir un problème en ce moment ! "Plein" de gens me l’ont fait remarquer. Je vais regarder ce qui ne fonctionne pas et j’essaierai d’arranger ça si possible. Quant à la question de l’élégance de la solution, je suis conscient que ce n’est pas élégant (ni légal) mais c’est la seule solution gratuite qui existe en ce moment. Au départ, c’était plus un défi que je me lançais à moi-même qu’un truc dont je voulais faire profiter les autres. Si tu as une autre solution, je suis preneur.

    Like

  3. Henry's avatar Henry says:

    C’est carrement tout à fait illegal et si Cine tELE Revue l’apprend, ca va te couter une fortune. Ces donnes sont tres cheres et sont copyrigtees. Tu vas te trouver en face de monstres comme RTBF, TF1 etc et tu vas claquer une fortune en proces. Faut quand meme si’maginer que parce qu’on sait ecrire 3 lignes en php on a le droit de tout piquer.

    Like

  4. Guillaume's avatar Guillaume says:

    Heu henry, au pire ils enverront un mail pour lui demander de retirer son script du net (ils ne pourront pas l’empecher de l’utiliser de manière perso…) donc t’emballe pas trop…

    Like

Leave a reply to Guillaume Cancel reply