DEV Community

Liam Anderson
Liam Anderson

Posted on

Convertir un PDF en Excel avec C# et VB.NET

Pourquoi convertir un PDF en Excel ?

Il peut y avoir plusieurs raisons pour lesquelles vous pourriez avoir besoin de convertir un fichier PDF en une feuille de calcul Excel:

  • Édition de données: Les fichiers PDF sont principalement conçus pour la visualisation, donc si vous avez besoin de modifier les données dans un tableau ou de manipuler les chiffres dans un PDF, vous voudrez peut-être le convertir en une feuille de calcul Excel.
  • Analyse de données: Excel fournit des outils puissants pour analyser et visualiser les données, tels que les tableaux croisés dynamiques, les graphiques et les diagrammes. Si vous avez des données dans un PDF que vous souhaitez analyser, les convertir en format Excel peut être utile.
  • Extraction de données: Si vous avez une grande quantité de données dans un PDF, vous voudrez peut-être extraire des pièces spécifiques de données et les organiser dans une feuille de calcul pour une analyse plus approfondie.

Convertir un PDF en Excel avec C# et VB.NET

Pour convertir des fichiers PDF en format Excel, cet article utilise une bibliothèque .NET PDF appelée Spire.PDF for .NET. Vous pouvez facilement installer Spire.PDF for .NET via NuGet en suivant ces étapes :

  • Créez ou ouvrez un projet dans Visual Studio.
  • Cliquez avec le bouton droit sur le projet dans l'explorateur de solutions et sélectionnez "Manage NuGet Packages".
  • Dans l'onglet "Browse", recherchez "Spire.PDF".
  • Sélectionnez "Spire.PDF" dans les résultats de la recherche et cliquez sur le bouton "Install".

Alternativement, vous pouvez également télécharger Spire.PDF for .NET depuis son site web officiel, extraire le package et ensuite ajouter les fichiers DLL sous le dossier Bin à votre projet comme références.

Convertir un PDF en Excel en C# et VB.NET avec Spire.PDF for .NET

Spire.PDF for .NET vous permet de convertir un fichier PDF multi-pages en un fichier Excel avec plusieurs feuilles ou en un fichier Excel avec une seule feuille.

Les exemples de code suivants montrent comment convertir un fichier PDF multi-pages en un fichier Excel avec plusieurs feuilles en C# et VB.NET en utilisant Spire.PDF for .NET:

C#

using Spire.Pdf;
using Spire.Pdf.Conversion;

namespace ConvertPdfToExcel
{
    class Program
    {
        static void Main(string[] args)
        {
            //Initialisez une instance de la classe PdfDocument
            PdfDocument pdf = new PdfDocument();
            //Chargez le document PDF
            pdf.LoadFromFile("Sample.pdf");

            //Enregistrer le document PDF en XLSX
            pdf.SaveToFile("PdfToExcel.xlsx", FileFormat.XLSX);
        }
    }
}
Enter fullscreen mode Exit fullscreen mode

VB.NET

Imports Spire.Pdf
Imports Spire.Pdf.Conversion

Namespace ConvertPdfToExcel
    Friend Class Program
        Private Shared Sub Main(ByVal args As String())
            'Initialisez une instance de la classe PdfDocument
            Dim pdf As PdfDocument = New PdfDocument()
            'Chargez le document PDF
            pdf.LoadFromFile("Sample.pdf")

            'Enregistrer le document PDF en XLSX
            pdf.SaveToFile("PdfToExcel.xlsx", FileFormat.XLSX)
        End Sub
    End Class
End Namespace
Enter fullscreen mode Exit fullscreen mode

Les exemples de code suivants montrent comment convertir un fichier PDF multi-pages en un fichier Excel avec une seule feuille en C# et VB.NET en utilisant Spire.PDF for .NET :

C#

using Spire.Pdf;
using Spire.Pdf.Conversion;

namespace ConvertPdfToExcel
{
    class Program
    {
        static void Main(string[] args)
        {
            //Initialisez une instance de la classe PdfDocument
            PdfDocument pdf = new PdfDocument();
            //Chargez le document PDF
            pdf.LoadFromFile("Sample1.pdf");

            //Initialisez une instance de la classe XlsxLineLayoutOptions et dans le constructeur de classe, définissez le premier paramètre - convertToMultipleSheet à false
            //Les quatre paramètres représentent : convertToMultipleSheet, showRotatedText, splitCell, wrapText
            XlsxLineLayoutOptions options = new XlsxLineLayoutOptions(false, true, true, true);
            //Définir les options de conversion de PDF en XLSX
            pdf.ConvertOptions.SetPdfToXlsxOptions(options);

            //Enregistrer le document PDF en XLSX
            pdf.SaveToFile("PdfToOneExcelSheet.xlsx", FileFormat.XLSX);
        }
    }
}
Enter fullscreen mode Exit fullscreen mode

VB.NET

Imports Spire.Pdf
Imports Spire.Pdf.Conversion

Namespace ConvertPdfToExcel
    Friend Class Program
        Private Shared Sub Main(ByVal args As String())
            'Initialisez une instance de la classe PdfDocument
            Dim pdf As PdfDocument = New PdfDocument()
            'Chargez le document PDF
            pdf.LoadFromFile("Sample1.pdf")

            'Initialisez une instance de la classe XlsxLineLayoutOptions et dans le constructeur de classe, définissez le premier paramètre - convertToMultipleSheet à false
            'Les quatre paramètres représentent : convertToMultipleSheet, showRotatedText, splitCell, wrapText
            Dim options As XlsxLineLayoutOptions = New XlsxLineLayoutOptions(False, True, True, True)
            'Définir les options de conversion de PDF en XLSX
            pdf.ConvertOptions.SetPdfToXlsxOptions(options)

            'Enregistrer le document PDF en XLSX
            pdf.SaveToFile("PdfToOneExcelSheet.xlsx", FileFormat.XLSX)
        End Sub
    End Class
End Namespace
Enter fullscreen mode Exit fullscreen mode

Conclusion

Dans cet article, nous avons discuté de la façon de convertir un PDF en Excel en C# et VB.NET avec la bibliothèque Spire.PDF pour .NET. En plus de la conversion de PDF en Excel, la bibliothèque prend également en charge la conversion de PDF vers de nombreux autres formats de fichier, tels que Word, PowerPoint, HTML, images, SVG, XPS et PostScript.

Top comments (0)