La conversion de HTML en Word est une compétence précieuse qui facilite la création de contenu et vous permet de tirer parti des puissantes fonctionnalités d'édition de Microsoft Word. Que vous souhaitiez réutiliser du contenu web, collaborer avec vos collègues en utilisant des documents Word ou simplement profiter des capacités de mise en forme et de style de Word, la conversion de HTML en Word offre une transition fluide. Dans cet article, nous explorerons comment convertir HTML ou une chaîne HTML en Word en utilisant Java.
Installez la bibliothèque requise
Pour convertir HTML en format Word, nous pouvons utiliser la bibliothèque Free Spire.Doc for Java.
Vous pouvez facilement importer le fichier jar de Free Spire.Doc for Java dans votre projet en ajoutant les configurations suivantes à votre fichier pom.xml du projet:
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.com/nexus/content/groups/public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.doc.free</artifactId>
<version>5.2.0</version>
</dependency>
</dependencies>
Vous pouvez également télécharger le package Free Spire.Doc for Java depuis son site officiel, extraire le package, puis importer manuellement le fichier Spire.Doc.jar du dossier lib du package dans votre projet.
Exemple 1. Convertir HTML en Word en utilisant Java
Le code ci-dessous montre comment convertir un fichier HTML en format Word en utilisant Java et Free Spire.Doc for Java:
import com.spire.doc.*;
import com.spire.doc.documents.XHTMLValidationType;
public class htmlFileToWord {
public static void main(String[] args) {
String inputFile="data/InputHtmlFile.html";
String outputFile="output/htmlFileToWord.docx";
// ouvrir un fichier html
Document document = new Document();
document.loadFromFile(inputFile, FileFormat.Html, XHTMLValidationType.None);
// enregistrer dans un document Word
document.saveToFile(outputFile, FileFormat.Docx);
}
}
Exemple 2. Convertir une chaîne HTML en Word en utilisant Java
Le code ci-dessous montre comment convertir une chaîne HTML en format Word en utilisant Java:
import com.spire.doc.*;
import java.io.*;
public class htmlStringToWord {
public static void main(String[] args) throws IOException {
String inputHtml = "data/InputHtml.txt";
String outputFile="output/htmlStringToWord.docx";
Document document = new Document();
// ajouter une section
Section sec = document.addSection();
String htmlText = readTextFromFile(inputHtml);
// ajouter un paragraphe et y ajouter la chaîne HTML
sec.addParagraph().appendHTML(htmlText);
// enregistrer dans un fichier Word
document.saveToFile(outputFile, FileFormat.Docx);
}
public static String readTextFromFile(String fileName) throws IOException{
StringBuffer sb = new StringBuffer();
BufferedReader br = new BufferedReader(new FileReader(fileName));
String content = null;
while ((content = br.readLine()) != null) {
sb.append(content);
}
return sb.toString();
}
}
Conclusion
La conversion de HTML en Word vous permet de réutiliser du contenu web, de faciliter la collaboration et de tirer parti des puissantes fonctionnalités d'édition de Word. En utilisant les extraits de code décrits dans cet article, vous pouvez automatiser facilement le processus de conversion de HTML en Word en utilisant le langage de programmation Java.
Sujets connexes
- Java : Convertir Word en images (JPG, PNG et SVG)
- Java : Convertir Word en PDF
- Java : Convertir RTF en document Word/docx et vice versa
- Java : Convertir Word en TIFF
- Java : Convertir Word en HTML
- Java : Convertir Word en XPS, XML, RTF, TXT et SVG
- Java : Convertir Word en PDF protégé par mot de passe
- Java : Convertir Word en EPUB
- Java : Convertir Word en PostScript
- Java : Convertir Word en PCL
- Java : Convertir XML en Word
- Java : Convertir Word en Excel
Top comments (0)