DEV Community

Liam Anderson
Liam Anderson

Posted on

[Java] Comment convertir HTML ou une chaîne HTML en Word

La conversion de HTML en Word est une compétence précieuse qui facilite la création de contenu et vous permet de tirer parti des puissantes fonctionnalités d'édition de Microsoft Word. Que vous souhaitiez réutiliser du contenu web, collaborer avec vos collègues en utilisant des documents Word ou simplement profiter des capacités de mise en forme et de style de Word, la conversion de HTML en Word offre une transition fluide. Dans cet article, nous explorerons comment convertir HTML ou une chaîne HTML en Word en utilisant Java.

Installez la bibliothèque requise

Pour convertir HTML en format Word, nous pouvons utiliser la bibliothèque Free Spire.Doc for Java.

Vous pouvez facilement importer le fichier jar de Free Spire.Doc for Java dans votre projet en ajoutant les configurations suivantes à votre fichier pom.xml du projet:

<repositories> 
    <repository> 
        <id>com.e-iceblue</id> 
        <name>e-iceblue</name> 
        <url>https://repo.e-iceblue.com/nexus/content/groups/public/</url> 
    </repository> 
</repositories> 
<dependencies> 
    <dependency> 
        <groupId>e-iceblue</groupId> 
        <artifactId>spire.doc.free</artifactId> 
        <version>5.2.0</version> 
    </dependency> 
</dependencies> 
Enter fullscreen mode Exit fullscreen mode

Vous pouvez également télécharger le package Free Spire.Doc for Java depuis son site officiel, extraire le package, puis importer manuellement le fichier Spire.Doc.jar du dossier lib du package dans votre projet.

Exemple 1. Convertir HTML en Word en utilisant Java

Le code ci-dessous montre comment convertir un fichier HTML en format Word en utilisant Java et Free Spire.Doc for Java:

import com.spire.doc.*; 
import com.spire.doc.documents.XHTMLValidationType; 

public class htmlFileToWord { 
    public static void main(String[] args) { 

        String inputFile="data/InputHtmlFile.html"; 
        String outputFile="output/htmlFileToWord.docx"; 

        // ouvrir un fichier html 
        Document document = new Document(); 
        document.loadFromFile(inputFile, FileFormat.Html, XHTMLValidationType.None); 

        // enregistrer dans un document Word 
        document.saveToFile(outputFile, FileFormat.Docx); 
    } 
} 
Enter fullscreen mode Exit fullscreen mode

Exemple 2. Convertir une chaîne HTML en Word en utilisant Java

Le code ci-dessous montre comment convertir une chaîne HTML en format Word en utilisant Java:

import com.spire.doc.*; 
import java.io.*; 

public class htmlStringToWord { 
    public static void main(String[] args) throws IOException { 

        String inputHtml = "data/InputHtml.txt"; 
        String outputFile="output/htmlStringToWord.docx"; 

        Document document = new Document(); 

        // ajouter une section 
        Section sec = document.addSection(); 

        String htmlText = readTextFromFile(inputHtml); 
        // ajouter un paragraphe et y ajouter la chaîne HTML 
        sec.addParagraph().appendHTML(htmlText); 

        // enregistrer dans un fichier Word 
        document.saveToFile(outputFile, FileFormat.Docx); 
    } 
    public static String readTextFromFile(String fileName) throws IOException{ 
        StringBuffer sb = new StringBuffer(); 
        BufferedReader br = new BufferedReader(new FileReader(fileName)); 
        String content = null; 
        while ((content = br.readLine()) != null) { 
            sb.append(content); 
        } 
        return sb.toString(); 
    } 
}
Enter fullscreen mode Exit fullscreen mode

Conclusion

La conversion de HTML en Word vous permet de réutiliser du contenu web, de faciliter la collaboration et de tirer parti des puissantes fonctionnalités d'édition de Word. En utilisant les extraits de code décrits dans cet article, vous pouvez automatiser facilement le processus de conversion de HTML en Word en utilisant le langage de programmation Java.

Sujets connexes

Top comments (0)