Ekran prezentujący panel CMS z opcją “Generate with AI” do automatycznego uzupełniania informacji o dokumencie.

Kategoryzacja dokumentów z AI: jak BetterRegulation skróciło czas pracy o 50%

Dla BetterRegulation opracowaliśmy silnik kategoryzacji dokumentów oparty na sztucznej inteligencji, który zmniejsza nakład pracy redakcyjnej o połowę. Rozwiązanie automatyzuje ekstrakcję i klasyfikację pól w dokumentach prawnych, znacząco usprawniając cały proces. System wykorzystujący Drupal Automators i mechanizmy AI zamienia godziny ręcznego tagowania w szybki, stabilny i powtarzalny workflow, zapewniający przejrzystą strukturę oraz wygodne wyszukiwanie złożonych treści prawnych.

Kluczowe rezultaty

50% oszczędności czasu
       Czas potrzebny na przetwarzanie dokumentów skrócił się o połowę.
 

Zaoszczędzona równowartość 1 etatu
       Uwolniono potencjał redakcyjny na potrzeby rozwoju.
 

Przetwarzanie trwające od 10 sekund do 2 minut
       Przetwarzanie AI vs minuty lub godziny ręcznej pracy.

Obsługa od 2 do 350 stron dokumentów
       System obsługuje dokumenty wszystkich rozmiarów.
 

Bardzo wysoka dokładność
       Minimalna liczba poprawek, mniej niż 5% pól wymaga korekty.
 

Zmniejszenie obciążenia poznawczego
       AI eliminuje konieczność czytania całego dokumentu.

O BetterRegulation

BetterRegulation.com to kompleksowa platforma informacji regulacyjnych, oferująca skonsolidowane i aktualne materiały legislacyjne, regulacyjne oraz wytyczne dla Wielkiej Brytanii i Irlandii. Od 2004 roku wspiera prawników, zespoły compliance i specjalistów z sektora finansowego, którzy potrzebują precyzyjnych, aktualnych i w pełni identyfikowalnych informacji prawnych.

Dzięki zespołowi redakcyjnemu z siedzibą w Londynie BetterRegulation przetwarza co miesiąc dużą liczbę dokumentów prawnych, z których każdy wymaga starannej kategoryzacji w wielu dziedzinach i taksonomiach, aby zachować jakość i użyteczność platformy.

Platforma obejmuje:

  • Skonsolidowane przepisy pierwotne i wtórne wraz z pełną historią zmian.
  • Prawo UE i międzynarodowe materiały regulacyjne dotyczące rynków brytyjskiego i irlandzkiego.
  • Standardy rachunkowości i wytyczne branżowe organów regulacyjnych.
  • Komentarze i analizy wiodących kancelarii prawnych i księgowych.
  • Historię zmian wraz z zaawansowanymi narzędziami porównawczymi.

Wyzwanie: przeciążony proces redakcyjny

Prawniczka korzystająca z platformy BetterRegulation do przeglądania dokumentów prawnych.

Ręczne przetwarzanie dokumentów na dużą skalę

Przetwarzanie dokumentów prawnych dla platformy zgodności wymaga skrupulatnej dbałości o szczegóły. Każdy statut, rozporządzenie lub wytyczne musiały zostać przeczytane, sklasyfikowane i oznaczone w około 15 różnych polach – od typu dokumentu i jurysdykcji po rok uchwalenia i organizację.

Dla zespołu redakcyjnego BetterRegulation ten ręczny proces stanowił poważne wąskie gardło operacyjne.

Pracownik kancelarii prawnej siedzący przed komputerem i przeglądający zawartość platformy BetterRegulation.

Dwustopniowy ręczny przepływ pracy

Przed wdrożeniem sztucznej inteligencji każdy dokument przechodził pracochłonny proces:

Krok 1: Czytanie i kategoryzacja dokumentów

Pierwszy redaktor:

  • otrzymuje nowy dokument prawny (o długości od 2 do 350 stron),
  • dokładnie czyta cały dokument, aby zrozumieć jego treść,
  • ręcznie wyodrębnia kluczowe informacje: rodzaj dokumentu, tytuł, rok, jurysdykcję, organizację,
  • odwołania do istniejących systemów taksonomicznych w celu zapewnienia spójnej kategoryzacji,
  • wypełnia około 15 różnych pól w systemie zarządzania treścią.


Wymagany czas: od 15 minut do kilku godzin na dokument, w zależności od długości i złożoności.

Krok 2: Weryfikacja jakości

Drugi redaktor:

  • sprawdza wszystkie kategoryzacje,
  • weryfikuje poprawność przypisania pól,
  • sprawdza zgodność ze standardami platformy.

Główne problemy

Czasochłonny proces

Czytanie i kategoryzowanie dokumentów prawnych wymagało znacznego nakładu czasu redakcyjnego. W przypadku dłuższych dokumentów, przekraczających 100 stron, przetworzenie jednego dokumentu mogło zająć nawet kilka godzin. Nakład czasu był konieczny, ale nie wykorzystywał wyższych umiejętności i wiedzy prawnej zespołu redakcyjnego.

Wyzwanie związane z alokacją zasobów

Około jeden pełny etat (1 FTE) był przeznaczony głównie na czytanie dokumentów i wstępną kategoryzację. Stanowiło to znaczną inwestycję zasobów w powtarzalne zadanie, które choć niezbędne, uniemożliwiało zespołowi skupienie się na bardziej strategicznych działaniach.

Obciążenie poznawcze i zmęczenie

Utrzymanie koncentracji podczas czytania długich tekstów prawnych zawierających złożoną terminologię prowadziło do zmęczenia redaktorów. To obciążenie poznawcze nie tylko spowalniało proces, ale także zwiększało ryzyko błędów w kategoryzacji, zwłaszcza w okresach dużego natężenia pracy lub pod koniec długich sesji czytania.

Ograniczenia skalowalności

Proces ręczny ograniczał liczbę dokumentów, które można było przetworzyć. Ich wzrost wymagałby proporcjonalnego zwiększenia liczby redaktorów, co było rozwiązaniem kosztownym i powolnym w skalowaniu. Stwarzało to trudną barierę dla możliwości rozszerzenia zasięgu platformy.

Wyzwania związane ze złożonością dokumentów

Same dokumenty stanowiły dodatkowe utrudnienie:

  • Różnorodne rozmiary: od krótkich, 2-3 stronicowych wytycznych po obszerne, 350-stronicowe ustawy.
  • Skomplikowany język prawniczy: wymagający uważnej lektury i interpretacji.
  • Wiele mapowań taksonomii: każdy dokument wymagał dokładnego przyporządkowania do wielu powiązanych ze sobą taksonomii (organizacja, jurysdykcja, rodzaj dokumentu, obszar ustawodawstwa itp.).
  • Różnorodne formaty: dokumenty historyczne miały różne formaty strukturalne, co utrudniało ekstrakcję tekstu.
  • Częste aktualizacje: zmiany legislacyjne wymagały ponownego przetworzenia istniejących dokumentów.

Czynniki wpływające na działalność platformy

To operacyjne wąskie gardło miało bezpośredni wpływ na działalność:

  • Ograniczona możliwość skalowania zakresu treści.
  • Wysokie koszty operacyjne w stosunku do wyników.
  • Opóźnienia w publikacji nowych dokumentów.
  • Zespół redakcyjny nie był w stanie skupić się na działaniach o większym znaczeniu.

BetterRegulation potrzebowało rozwiązania, które pozwoliłoby utrzymać wysokie standardy dokładności przy jednoczesnej znacznej poprawie wydajności przetwarzania. Celem było uwolnienie zespołu redakcyjnego od żmudnej pracy polegającej na czytaniu dokumentów i wstępnej kategoryzacji, aby mógł skupić się na weryfikacji, kontroli jakości i strategicznych decyzjach redakcyjnych.

Rozwiązanie: proces redakcyjny wspomagany przez AI

Laptop z ekranem, na którym wyświetla się panel Drupala i opcja generowania z AI dla redaktorów BetterRegulation.

Podejście: wzbogacaj, nie zastępuj

Firma Droptica podeszła do tego wyzwania, badając, w jaki sposób sztuczna inteligencja może wzbogacić – a nie zastąpić – proces redakcyjny. Dzięki wspólnym sesjom odkrywczym z BetterRegulation skupiliśmy się na jasnym celu: wyeliminowaniu czasochłonnych zadań związanych z ręcznym czytaniem i wprowadzaniem danych, przy jednoczesnym zachowaniu kontroli nad jakością i podejmowaniem decyzji przez redaktorów.

Filozofia była prosta: niech sztuczna inteligencja zajmuje się żmudną, powtarzalną pracą, a ludzie – oceną, weryfikacją i kontrolą jakości.

Faza odkrywania i testowania

Zamiast od razu przystępować do wdrażania, zespół Droptica przeprowadził dokładne testy różnych podejść, aby upewnić się, że rozwiązanie będzie niezawodne, dokładne i gotowe do użycia na produkcji.

Widok ustawień modułu AI Automator, który stanowi techniczną bazę działania funkcji “Generate with AI”.

Metody przetwarzania plików PDF

Pliki PDF o charakterze prawnym są niezwykle złożone. Często zawierają:

  • wiele kolumn i skomplikowane układy,
  • nagłówki, stopki i numery stron w całym dokumencie,
  • osadzone obrazy i grafiki,
  • tabele i dane strukturalne,
  • różne czcionki i style formatowania.

Oceniliśmy wiele metod wyodrębniania czystego, użytecznego tekstu:

  1. Bezpośrednie przesyłanie plików PDF do API ChatGPT – ujawniło ograniczenia związane ze złożonym formatowaniem i rozmiarem plików.
  2. Tradycyjne biblioteki do analizowania plików PDF – miały problemy z niespójnymi strukturami dokumentów i generowały nieczytelne wyniki.
  3. Unstructured.io – wyłonił się jako zdecydowany zwycięzca.

Wybór Unstructured.io okazał się kluczowy. Zespół stwierdził, że nie ma kontroli nad konstrukcją plików PDF – dokumenty prawne często zawierają liczne znaczniki formatowania i metadane, które mogą “zatykać” okno kontekstowe i dezorientować sztuczną inteligencję. Dzięki Unstructured.io można je odfiltrować już na etapie ekstrakcji. Zespół zauważył również znacznie większą dokładność i szybsze przetwarzanie w porównaniu z innymi metodami.

Panel z ustawieniami prompta, w którym są określone instrukcje dotyczące generowania informacji z AI.

Wybór modelu językowego

Zespół przetestował wiele dużych modeli językowych, oceniając je według trzech kluczowych kryteriów:

  1. Dokładność: czy model potrafił poprawnie zidentyfikować i sklasyfikować informacje zawarte w dokumencie?
  2. Szybkość: jak szybko może przetwarzać dokumenty o objętości od 2 do 350 stron?
  3. Koszt: jaki był koszt tokenu per dokument przy oczekiwanych wolumenach?

Po przeprowadzeniu szeroko zakrojonych testów z wykorzystaniem rzeczywistych dokumentów BetterRegulation zdecydowaliśmy się na model GPT-4o-mini jako najlepiej dopasowany do aktualnych potrzeb projektu. Jednocześnie proces rozwoju pozostaje otwarty na testowanie innych modeli. Jeśli w przyszłości pojawią się rozwiązania oferujące lepszy balans między jakością, wydajnością i możliwościami, zastosowany model może zostać zmieniony. Na obecnym etapie GPT-4o-mini zapewnia odpowiednią równowagę między szybkością, dokładnością oraz wystarczająco dużym oknem kontekstowym (128 tys. tokenów), umożliwiającym pracę nawet z najdłuższymi dokumentami.


Inżynieria promptów

Znaczny wysiłek włożono w opracowanie promptów, które w niezawodny sposób wyodrębniałyby i kategoryzowały informacje. Ten iteracyjny proces obejmował:

  • Określenie jasnych, jednoznacznych instrukcji dotyczących wyodrębniania pól.
  • Dostarczenie kompletnych list taksonomicznych w kontekście podpowiedzi.
  • Określenie dokładnych formatów wyjściowych JSON w celu zapewnienia spójnego parsowania.
  • Dodanie reguł walidacji i obsługi przypadków skrajnych.
  • Testowanie z wykorzystaniem setek rzeczywistych dokumentów w celu udoskonalenia dokładności.

Jak to działa?

Widok ekranu z perspektywy edytora, gdzie można jednym kliknięciem włączyć proces generowania informacji z AI.

Funkcja autouzupełniania

Rozwiązanie płynnie integruje się z istniejącym procesem redakcyjnym BetterRegulation opartym na Drupal 11.

Z perspektywy redaktora:

  1. Przesyłanie pliku PDF: redaktor tworzy nowy wpis dokumentu i przesyła plik PDF do pola „Oryginalny dokument”.
  2. Wybranie opcji „Generuj za pomocą AI”: jedno kliknięcie przycisku uruchamia przetwarzanie AI.
  3. Krótkie oczekiwanie: od 10 sekund do 2 minut w zależności od rozmiaru dokumentu (nie ma potrzeby odświeżania strony).
  4. Dostosowanie w razie potrzeby: redaktor może zmodyfikować dowolne pole przed zapisaniem.
  5. Zapisanie i publikacja: dokument jest gotowy do umieszczenia na platformie.

Transformacja doświadczenia:

  • Wcześniej: od 15 minut do kilku godzin czytania i ręcznego wprowadzania danych.
  • Teraz: wystarczy kliknąć przycisk, chwilę poczekać i wysłać recenzję.

Redaktorzy zachowują kontrolę. Mogą modyfikować dowolne automatycznie wypełnione pola przed zapisaniem. Pozwala to zachować standardy jakości przy jednoczesnym wyeliminowaniu żmudnej pracy.

Panel edytora, w którym widać obszary dokumentu uzupełniane automatycznie przez AI.

Pola wypełniane automatycznie przez AI

System wypełnia około 15 pól, w tym:

Pola tekstowe:

  • Tytuł – wyodrębniony i oczyszczony tytuł dokumentu.
  • Treść/podsumowanie – kluczowe fragmenty treści wyodrębnione z dokumentu.

Odniesienia taksonomiczne:

  • Typ dokumentu – ustawa, rozporządzenie, wytyczne, kodeks itp.
  • Organizacja – organ wydający lub organ regulacyjny.
  • Obszar dokumentu – klasyfikacja tematyczna.
  • Ustawodawstwo dotyczące dokumentu – powiązane ramy prawne.

Odniesienia do podmiotów:

  • Jurysdykcja – Wielka Brytania, Irlandia, UE (może być więcej niż jedna) etc.

Pola daty:

  • Rok – kiedy dokument został uchwalony lub opublikowany.

Pola adresu URL:

  • Źródło URL – oficjalna lokalizacja publikacji.

Oraz dodatkowe pola metadanych specyficzne dla modelu treści BetterRegulation.

Ustawienia techniczne dla platformy BetterRegulation, aby poprawnie działało wsparcie AI.

Innowacja techniczna: inteligentne mapowanie taksonomii

Kluczowym osiągnięciem technicznym jest sposób, w jaki system obsługuje odniesienia taksonomiczne w Drupalu. Sztuczna inteligencja nie tylko wyodrębnia tekst, ale także inteligentnie mapuje wyodrębnione informacje do istniejących terminów taksonomicznych w bazie danych Drupala.

Oto, jak to działa:

  1. Wprowadzanie kontekstu: system zawiera pełną listę dostępnych terminów taksonomicznych dla każdego pola w poleceniu wysyłanym do sztucznej inteligencji.
  2. Dopasowanie semantyczne: AI analizuje treść dokumentu i dopasowuje ją do tych terminów na podstawie znaczenia, a nie tylko słów kluczowych.
  3. Zwrot identyfikatora: zwraca nie tylko dopasowane nazwy terminów, ale także konkretne identyfikatory encji w Drupalu.
  4. Tworzenie odniesień do encji: moduł Drupal Automators tworzy następnie odpowiednie odniesienia do encji przy użyciu tych identyfikatorów

Takie podejście zapewnia:

  • Płynną integrację z istniejącą architekturą treści BetterRegulation.
  • Brak „osieroconych” terminów lub niespójności danych.
  • Prawidłowe relacje między dokumentami a taksonomiami.
  • Możliwość utrzymania struktury danych w miarę ewolucji taksonomii.

Architektura techniczna

Rozwiązanie opiera się na solidnej, gotowej do użycia na produkcji architekturze zaprojektowanej z myślą o niezawodności i skalowalności.

Stos technologiczny:

  • Drupal 11 – platforma zarządzania treścią.

  • Drupal Automators (moduł contrib) – koordynuje przepływy pracy AI i zarządza logiką przetwarzania.

  • Unstructured.io (Extracture) – ekstrakcja i czyszczenie tekstu z plików PDF, samodzielnie hostowane w celu zapewnienia kontroli.

  • GPT-4o-mini (OpenAI) – model językowy do analizy i kategoryzacji tekstu.

  • RabbitMQ – kolejka komunikatów do przetwarzania w tle (używana do funkcji podsumowania).

  • Watchdog – kompleksowe logowanie i monitorowanie błędów.

Przebieg przetwarzania:

Graficzna prezentacja procesu przetwarzania treści z AI na platformie BetterRegulation.

Kluczowe decyzje techniczne

WyzwanieRozwiązanieUzasadnienie
Złożone formatowanie plików PDFUnstructured.ioDoskonałe filtrowanie artefaktów PDF, lepsza obsługa tabel i układów wielokolumnowych, wyższa dokładność ekstrakcji.
Wybór modeluGPT-4o-miniOptymalna równowaga między szybkością, dokładnością i kosztami, duże okno kontekstowe (128 tys. tokenów) obsługuje najdłuższe dokumenty.
Format wyjściowyStrukturalny JSON ze schematemZapewnia spójne, możliwe do analizy odpowiedzi; weryfikuje zgodność z oczekiwanymi typami pól.
Dopasowanie taksonomiiPełne listy taksonomii zawarte w podpowiedziSztuczna inteligencja może dopasowywać semantycznie, a nie na podstawie dokładnych słów kluczowych; zwraca właściwe identyfikatory podmiotów.
Doświadczenie użytkownikaSynchroniczne przetwarzanie na żądanieRedaktorzy widzą natychmiastowe wyniki; mogą je zweryfikować przed zapisaniem; nie muszą czekać na zadania w tle.
Duże dokumentyŁagodna degradacjaDokumenty przekraczające limity tokenów są oznaczane do ręcznej weryfikacji z wyraźnymi komunikatami o błędach.
NiezawodnośćKompleksowe rejestrowanie błędówWszystkie awarie są rejestrowane w Watchdog wraz z kontekstem; pulpit administracyjny pokazuje status przetwarzania.

Wybór technologii

Duże dokumenty (>350 stron lub przekraczające limity tokenów):

Gdy dokumenty zbliżają się do limitów okna kontekstowego lub je przekraczają:

  • System próbuje przetworzyć cały dokument.
  • Jeśli limity tokenów zostaną przekroczone, przetwarzanie zostanie płynnie zakończone.
  • Dokument jest oznaczany w kolejce „ręcznej weryfikacji” administratora.
  • Redaktorzy otrzymują jasny komunikat o błędzie.
  • Redaktorzy mogą użyć pola „PDF utworzony przez administratora”, aby przesłać skróconą wersję lub kluczowe fragmenty.
  • Ten alternatywny plik PDF może być następnie pomyślnie przetworzony.

Nieudane przetwarzanie:

  • Wszystkie błędy są kompleksowo rejestrowane w Watchdog w Drupalu.
  • Pulpit administratora pokazuje status przetwarzania wszystkich dokumentów.
  • Dokumenty, których przetwarzanie zakończyło się niepowodzeniem, można ponownie uruchomić ręcznie za pomocą jednego kliknięcia.
  • Szczegółowe komunikaty o błędach pomagają zdiagnozować problemy (błędy API, nieprawidłowo sformatowane pliki PDF itp.).
  • Logika ponownych prób automatycznie obsługuje przejściowe awarie.

Poziomy kontroli jakości:

  1. Przetwarzanie AI – wstępna ekstrakcja i kategoryzacja.
  2. Recenzja redaktora – weryfikacja i dostosowanie wszystkich pól przez człowieka.
  3. Redaktor ds. kontroli jakości – druga weryfikacja przez człowieka przed ostateczną publikacją.
  4. Stałe monitorowanie – śledzenie wskaźników dokładności i typowych wzorców korekt.

Sztuczna inteligencja wspomaga, ale nie zastępuje ludzkiej oceny. To wielopoziomowe podejście zapewnia utrzymanie wysokich standardów BetterRegulation przy jednoczesnym uzyskaniu znacznych korzyści w zakresie wydajności.

Rezultaty: transformacyjny wzrost wydajności

50% oszczędności czasu w przetwarzaniu dokumentów

Najbardziej znaczącym i natychmiastowo mierzalnym rezultatem jest radykalne skrócenie czasu potrzebnego na przetwarzanie dokumentów.

Przed wdrożeniem sztucznej inteligencji:

  • od 20 minut do kilku godzin na dokument w przypadku wstępnego czytania i kategoryzacji,
  • duża zmienność w zależności od długości i złożoności dokumentu,
  • pełne, nieustanne skupienie redaktora wymagana podczas całego procesu,
  • średnia wydajność przetwarzania: 3-8 dokumentów dziennie na redaktora w przypadku złożonych dokumentów.

Po wdrożeniu sztucznej inteligencji:

  • od 10 sekund do 2 minut na przetworzenie przez sztuczną inteligencję (w zależności od rozmiaru dokumentu),
  • przewidywalny, stały czas przetwarzania niezależnie od złożoności dokumentu,
  • dodatkowe 5 minut na przegląd i weryfikację przez redaktora (skoncentrowane, mniejsze obciążenie poznawcze),
  • średnia wydajność przetwarzania: 6 dokumentów na godzinę (do 8 razy szybciej).

BetterRegulation pozwala uzyskać 50% ogólnej oszczędności czasu w całym procesie pozyskiwania, kategoryzacji, przeglądu i publikacji dokumentów.

Uwolnienie wydajności odpowiadającej jednemu etatowi

To, co kiedyś pochłaniało cały dzień pracy redaktora, teraz zajmuje godzinę. Sztuczna inteligencja realizuje żmudną część zadania – czytanie i wyodrębnianie informacji – podczas podczas gdy edytorzy mogą skupić się na weryfikacji i kontroli jakości.

Oznacza to uwolnienie równowartości jednego pełnego etatu (1 FTE) w zakresie zdolności redakcyjnych, które można przeznaczyć na prace o większej wartości.

Korzyści dla redakcji:

  • Przeniesienie do zadań strategicznych: analiza dokumentów, inicjatywy poprawy jakości, uwzględnianie opinii użytkowników.
  • Zmiana punktu ciężkości: z ręcznego wprowadzania danych na weryfikację jakości i ocenę redakcyjną.
  • Większa satysfakcja z pracy: redaktorzy zgłaszają znacznie mniejsze zmęczenie i większe zaangażowanie.
  • Wykorzystanie umiejętności: wiedza prawnicza jest teraz wykorzystywana do weryfikacji i poprawy, a nie tylko do czytania.
  • Rozwój kariery: redaktorzy mogą podejmować się bardziej złożonych i wymagających zadań.

Korzyści biznesowe:

  • Zwiększona wydajność: możliwość przetwarzania około dwukrotnie większej liczby dokumentów bez konieczności zatrudniania dodatkowych pracowników.
  • Brak dodatkowych kosztów zatrudnienia: oszczędność kosztów rzędu ~30–50 tys. funtów rocznie (jeden etat).
  • Lepsze przygotowanie do rozwoju: platforma może skalować zakres dokumentów bez proporcjonalnego wzrostu zatrudnienia.
  • Szybsza reakcja na zmiany: możliwość szybkiego przetwarzania i publikowania nowych zmian regulacyjnych.
  • Bardziej spójna jakość wyników: mniej różnic wynikających ze zmęczenia lub presji związanej z obciążeniem pracą.

Skalowalność bez wzrostu liczby pracowników

Być może najważniejsze dla działalności BetterRegulation jest to, że rozwiązanie AI zapewnia skalowalność, która wcześniej wymagałaby proporcjonalnego wzrostu liczby pracowników.

Elastyczność operacyjna:

  • Możliwość przetwarzania dwukrotnie większej liczby dokumentów bez dodatkowych redaktorów.
  • Szybkie dostosowanie do zmian regulacyjnych, które tymczasowo zwiększają przepływ dokumentów.
  • Obsługuje sezonowe wzrosty (np. sesje legislacyjne pod koniec roku) bez konieczności pracy w nadgodzinach lub zatrudniania pracowników tymczasowych.
  • Utrzymuje stałą jakość niezależnie od ilości.

Wspieranie rozwoju działalności:

  • Możliwość rozszerzenia zasięgu na dodatkowe jurysdykcje bez proporcjonalnego wzrostu kosztów.
  • Możliwość obsługi bardziej kompleksowych typów dokumentów bez zatorów w przepływie pracy.
  • Ewolucja platformy nieograniczona możliwościami redakcyjnymi.
  • Przewaga konkurencyjna dzięki bardziej kompleksowej i aktualnej treści.

Efektywność kosztowa:

  • Skrócony czas szkolenia nowych redaktorów (nacisk na weryfikację zamiast pełnego czytania).
  • Niższe koszty operacyjne na przetworzony dokument.
  • Lepsza alokacja zasobów w całej firmie.
  • Poprawa zwrotu z inwestycji w zespół redakcyjny.

Wskaźniki niezawodności:

  • Wskaźnik skuteczności: >95% dokumentów przetwarzanych bez błędów.
  • Wskaźnik dokładności: bardzo wysoki – <5% pól wymaga korekty redaktora.
  • Dostępność: ponad 99% czasu pracy usługi przetwarzania.
  • Odzyskiwanie błędów: automatyczne ponowne próby obsługują przejściowe awarie.

Innowacje techniczne: sukces Drupal + AI

Projekt ten pokazuje możliwości nowoczesnego Drupala w zakresie zaawansowanej integracji AI.

Dlaczego ta architektura działa?

Płynna integracja z Drupalem

W przeciwieństwie do dodatkowych rozwiązań AI, ta implementacja jest głęboko zintegrowana z rdzeniem Drupala:

  • natywne formularze Drupala z funkcjami opartymi na sztucznej inteligencji,
  • pełna integracja z systemem encji i pól w Drupalu,
  • zgodność z uprawnieniami Drupala i procesami redakcyjnymi,
  • współpraca z istniejącymi typami treści i taksonomiami,
  • brak oddzielnych interfejsów lub przełączania kontekstu dla redaktorów.

Moduł Drupal Automators

Moduł Drupal Automators okazał się niezwykle przydatny:

  • zapewnia przejrzystą abstrakcję dla przepływów pracy AI,
  • obsługuje koordynację wieloetapowego przetwarzania,
  • zarządza połączeniami z zewnętrznymi usługami AI,
  • oferuje interfejs użytkownika administratora do konfiguracji i monitorowania,
  • obsługuje złożoną inżynierię podpowiedzi i analizę odpowiedzi.

Gotowy na produkcję od pierwszego dnia

To nie jest prototyp. To system produkcyjny obsługujący krytyczne dla działalności przepływy pracy:

  • kompleksową obsługą błędów i rejestrowanie,
  • łagodne pogorszenie jakości w skrajnych przypadkach,
  • pełne monitorowanie i widoczność dla administratorów,
  • logika ponawiania prób i odporność na awarie,
  • kwestie bezpieczeństwa (zarządzanie kluczami API, prywatność danych).

Rozszerzalna architektura

Architektura techniczna została zaprojektowana z myślą o rozszerzalności:

  • modułowa konstrukcja umożliwia łatwe aktualizacje i ulepszenia,
  • proces przetwarzania można dostosować do dodatkowych typów dokumentów,
  • wyraźne rozdzielenie przetwarzania AI od integracji z Drupal,
  • podstawa dla przyszłych funkcji AI (już wykorzystaliśmy ją do tworzenia streszczeń dokumentów).

Podoba Ci się ten projekt? Stwórz z nami system kategoryzacji dokumentów AI!

Umów się na bezpłatne spotkanie, aby omówić swoje cele i wymagania dotyczące kategoryzacji dokumentów za pomocą sztucznej inteligencji.

Skontaktujemy się z Tobą, aby dowiedzieć się, w jaki sposób możemy pomóc Ci zapewnić użytkownikom natychmiastowy dostęp do Twoich treści.