Przejdź do zawartości

Retrieval-augmented generation

Z Wikipedii, wolnej encyklopedii

Generowanie wspomagane wyszukiwaniem[1], ang. retrieval-augmented generation[2][3] (RAG) – technika umożliwiająca modelom GenAI wyszukiwanie i włączanie nowych, zewnętrznych informacji[4][5]. RAG modyfikuje zapytania do dużego modelu językowego (LLM) tak, aby odpowiadał on na pytania użytkowników z uwzględnieniem dodatkowych, dołączonych danych[6]. Umożliwia to LLM-om korzystanie z informacji specyficznych dla danej dziedziny i/lub zaktualizowanych[6][7].

Oprócz zwiększenia jakości zwracanych odpowiedzi, RAG pozwala również LLM-om na uwzględnianie w generowanych treściach odniesień do źródeł, co umożliwia użytkownikom weryfikację informacji poprzez analizę cytowanych dokumentów lub oryginalnych źródeł. Dzięki temu możliwe jest uzyskanie większej wiarygodności i transparentność, ponieważ użytkownicy mogą sprawdzać pobrane treści, aby upewnić się co do ich dokładności, trafności i pochodzenia[8][9].

Termin RAG został po raz pierwszy wprowadzony w 2020 r. przez Meta[10][11]. Istnieją biblioteki umożliwiające wdrożenie technik RAG wraz z ich specyficznymi funkcjonalnościami[12].

Proces

[edytuj | edytuj kod]
Uproszczony schemat schematu wzbogacania danych z wykorzystaniem LLM

RAG składa się z czterech elementów[13]:

  1. Indexing (pol. indeksowanie) – dodatkowe dane dostarczane do systemu są osadzane i zapisywane w bazie danych[14].
  2. Retrieval (pol. pobieranie) – pobieranie najbardziej odpowiednich dokumentów dla danego zapytania.
  3. Augmentation (pol. uzupełnianie) – przekazanie pobranych informacji do LLMa za pomocą inżynierii podpowiedzi.
  4. Generation (pol. generowanie) – LLM zwraca odpowiedź w oparciu o wzbogacone dane i zapytanie użytkownika[15]. Niektóre modele mogą korzystać z innych technik wzbogacania odpowiedzi[13].

Przypisy

[edytuj | edytuj kod]
  1. Leandro von Werra, Lewis Tunstall, Thomas Wolf, Przetwarzanie języka naturalnego z wykorzystaniem transformerów: budowanie aplikacji językowych za pomocą bibliotek Hugging Face, Grzegorz Werner (tłum.), Gliwice: Helion, 2024, s. 206, ISBN 978-83-289-0711-9 [dostęp 2025-04-16].
  2. Krzysztof Klimczyk, Aplikacja wspomagająca tworzenie serwerów urządzeń w środowisku Tango Controls [online], 25 listopada 2024 [dostęp 2025-04-12].
  3. Adam Karolewski, Sztuczna inteligencja w poszukiwaniu wiedzy, „Biuletyn EBIB” (213), 22 maja 2024, ISSN 1507-7187 [dostęp 2025-04-12] (pol.).
  4. What is retrieval-augmented generation (RAG)? [online], IBM Research, 9 lutego 2021 [dostęp 2025-04-12] (ang.).
  5. Maciej Kaszkowiak, RAG, czyli jak rozmawiać z naszymi dokumentami? [online], kaszkowiak.org, 20 grudnia 2023 [dostęp 2025-04-12] (pol.).
  6. a b Why Google's AI Overviews gets things wrong. MIT Technology Review, 31 May 2024. [dostęp 7 March 2025].
  7. Rahul Singhal: The Power Of RAG: How Retrieval-Augmented Generation Enhances Generative AI. Forbes, Nov 30, 2023.
  8. Tianyu Gao i inni, Enabling Large Language Models to Generate Text with Citations, arXiv, 31 października 2023, DOI10.48550/arXiv.2305.14627 [dostęp 2025-04-12].
  9. Kevin Wu i inni, How well do LLMs cite relevant medical references? An evaluation framework and analyses, arXiv, 3 lutego 2024, DOI10.48550/arXiv.2402.02008 [dostęp 2025-04-12].
  10. Patrick Lewis i inni, Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, arXiv, 12 kwietnia 2021, DOI10.48550/arXiv.2005.11401 [dostęp 2025-04-12].
  11. Rahul Singhal, The Power Of RAG: How Retrieval-Augmented Generation Enhances Generative AI [online], Forbes [dostęp 2025-04-12] (ang.).
  12. Xiaohua Wang i inni, Searching for Best Practices in Retrieval-Augmented Generation, arXiv, 1 lipca 2024, DOI10.48550/arXiv.2407.01219 [dostęp 2025-04-13].
  13. a b Penghao Zhao i inni, Retrieval-Augmented Generation for AI-Generated Content: A Survey, arXiv, 21 czerwca 2024, DOI10.48550/arXiv.2402.19473 [dostęp 2025-04-12].
  14. Understanding Retrieval-Augmented Generation: Part 1 [online], www.bentoml.com [dostęp 2025-04-12] (ang.).
  15. Patrick Lewis i inni, Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, arXiv, 12 kwietnia 2021, DOI10.48550/arXiv.2005.11401 [dostęp 2025-04-13].