Convertir un fichier PDF en fichiers HTML
Par Oaz, le 9 avril 2006, 20:50 - Amanèls
- Lien permanent
-
J'ai eu besoin d'un logiciel effectuant une conversion d'un fichier PDF vers des pages HTML afin de récupérer plus facilement le contenu de ce fichier. En faisant un peu de Google, on tombe rapidement sur un logiciel nommé PDF2HTML.
Ce logiciel a une particularité très rare : c'est un "shareware GPL". Il est distribué sous licence GPL car il contient de morceaux de XPdf qui est lui même GPL. Et il est Shareware car l'auteur distribue une version non enregistrée dont le nombre de conversions est limité. Il faut acheter une clef pour avoir la version complète.
L'ironie de cette situation est que, le logiciel étant GPL, son code source est disponible. Il suffit donc de le télécharger et de le modifier très légèrement pour obtenir le même logiciel en version enregistrée. Et ce en toute légalité puisque la GPL nous octroie ce droit !
J'ai même le droit de distribuer le logiciel modifié en conservant la license GPL. C'est donc ce que je fais ici en laissant en téléchargement une version illimitée de PDF2HTML 1.6 (958 Ko). Le code source modifié est bien évidemment inclus dans l'archive.
Ce logiciel a une particularité très rare : c'est un "shareware GPL". Il est distribué sous licence GPL car il contient de morceaux de XPdf qui est lui même GPL. Et il est Shareware car l'auteur distribue une version non enregistrée dont le nombre de conversions est limité. Il faut acheter une clef pour avoir la version complète.
L'ironie de cette situation est que, le logiciel étant GPL, son code source est disponible. Il suffit donc de le télécharger et de le modifier très légèrement pour obtenir le même logiciel en version enregistrée. Et ce en toute légalité puisque la GPL nous octroie ce droit !
J'ai même le droit de distribuer le logiciel modifié en conservant la license GPL. C'est donc ce que je fais ici en laissant en téléchargement une version illimitée de PDF2HTML 1.6 (958 Ko). Le code source modifié est bien évidemment inclus dans l'archive.


Commentaires
Intéressé par ce programme, j'ai téléchargé à partir du lien situé dans l'article, et aussi l'exe en annexe (apparement la même chose).
Dans les deux cas, j'obtiens un fichier nommé "pfpmyvisites.php".
Cependant, cette fois-ci, 7Zip le reconnait comme archive, et arrive à l'ouvrir, et il contient bien PDF2HTML.
Est-ce un problème chez moi où chez vous?
Même remarque que sur le billet concernant l'extension dotclear "templateWidget" : le problème n'est pas chez moi mais pas vraiment non plus chez vous.
Il s'agit juste d'un serveur et d'un client qui ne s'accordent pas sur la manière d'envisager le protocole http.
Le lien direct de télécahrgement est : http://www.azeau.com/dotclear/public/amanels/pdf2html_setup.exe