Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Von Bedeutung
Dieses Feature befindet sich in der öffentlichen Vorschau und ist HIPAA-kompatibel.
Die Dokumentanalyse verwendet modernste Forschungstechniken, um strukturierte Daten aus einer Vielzahl von Dokumenttypen zu extrahieren und zu visualisieren, einschließlich, aber nicht beschränkt auf PDFs, Bilder, Word-Dokumente (DOC/DOCX) und PowerPoint-Dateien (PPT/PPTX). Es wurde entwickelt, um komplexe Layouts wie Tabellen, Diagramme und gemischten Textbildinhalt zu behandeln.
Das Dokumentenparsing basiert auf der ai_parse_document-Funktion und enthält eine Benutzeroberfläche, mit der Sie Dokumente analysieren und deren Struktur sofort durch formatierten Text oder strukturierte JSON-Ausgaben inspizieren können.
Anforderungen
- Ein Arbeitsbereich, der Folgendes umfasst:
- AI ParseDocument Public Preview aktiviert. Siehe Verwalten von Azure Databricks-Vorschauen.
- Serverloses Rechnen aktiviert Siehe Serverlose Computeanforderungen.
- Unity-Katalog aktiviert. Weitere Informationen finden Sie unter Aktivieren eines Arbeitsbereichs für Unity Catalog.
- Zugriff auf eine serverlose Budgetrichtlinie mit einem Budget ungleich Null.
- Diese Funktion ist nur in einigen Regionen verfügbar, siehe Verfügbarkeit der KI-Funktion.
- Die
ai_parse_documentFunktion ist auch für Arbeitsbereiche mit dem Add-On "Erweiterte Sicherheit und Compliance" verfügbar, aber Arbeitsbereichsadministratoren müssen sie im Vorschauportal aktivieren.
- Die
Analysieren von Dokumenten
Verwenden Sie die Dokumentanalyse, um Ihre Dokumente zu analysieren und ihre Struktur zu visualisieren.
- Wechseln Sie zum
Agents im linken Navigationsbereich Ihres Arbeitsbereichs.
- Klicken Sie auf Create Agent>Document Parsing.
- Wählen Sie Ihr Quelldokument aus. Sie können eine Datei hochladen oder eine datei aus einem vorhandenen Unity-Katalog auswählen. Unterstützte Formate sind: PDF, Bilder, DOC/DOCX und PPT/PPTX.
- Klicken Sie auf "Dokument analysieren".
Das Analysieren ihres Dokuments kann einige Minuten dauern. Nach Abschluss der Dokumentanalyse wird das Quelldokument auf der linken Seite und das analysierte Dokument auf der rechten Seite angezeigt. Sie können das analysierte Dokument als formatierten Text oder JSON-Rohformat anzeigen.
Prozess- und Abfrageergebnisse
Wenn Sie die ai_parse_document Abfrage anzeigen und auf weiteren Dokumenten ausführen möchten, klicken Sie auf "Agent verwenden ", und wählen Sie entweder die Abfrage aus dem SQL-Editor oder -Notizbuch aus. Sie können die Abfrage bearbeiten, um auf das Volume oder die Tabelle zu verweisen, in denen Ihre Dokumente aufbewahrt werden.
Die Dokumentanalyse stellt eine Benutzeroberfläche für die SQL-Funktion bereit ai_parse_document. Weitere Beispiele und Details finden Sie auf der ai_parse_document Referenzseite.