Retrieval-augmented generation
Generowanie wspomagane wyszukiwaniem[1], ang. retrieval-augmented generation[2][3] (RAG) – technika umożliwiająca modelom GenAI wyszukiwanie i włączanie nowych, zewnętrznych informacji[4][5]. RAG modyfikuje zapytania do dużego modelu językowego (LLM) tak, aby odpowiadał on na pytania użytkowników z uwzględnieniem dodatkowych, dołączonych danych[6]. Umożliwia to LLM-om korzystanie z informacji specyficznych dla danej dziedziny i/lub zaktualizowanych[6][7].
Oprócz zwiększenia jakości zwracanych odpowiedzi, RAG pozwala również LLM-om na uwzględnianie w generowanych treściach odniesień do źródeł, co umożliwia użytkownikom weryfikację informacji poprzez analizę cytowanych dokumentów lub oryginalnych źródeł. Dzięki temu możliwe jest uzyskanie większej wiarygodności i transparentność, ponieważ użytkownicy mogą sprawdzać pobrane treści, aby upewnić się co do ich dokładności, trafności i pochodzenia[8][9].
Termin RAG został po raz pierwszy wprowadzony w 2020 r. przez Meta[10][11]. Istnieją biblioteki umożliwiające wdrożenie technik RAG wraz z ich specyficznymi funkcjonalnościami[12].
Proces
[edytuj | edytuj kod]
RAG składa się z czterech elementów[13]:
- Indexing (pol. indeksowanie) – dodatkowe dane dostarczane do systemu są osadzane i zapisywane w bazie danych[14].
- Retrieval (pol. pobieranie) – pobieranie najbardziej odpowiednich dokumentów dla danego zapytania.
- Augmentation (pol. uzupełnianie) – przekazanie pobranych informacji do LLMa za pomocą inżynierii podpowiedzi.
- Generation (pol. generowanie) – LLM zwraca odpowiedź w oparciu o wzbogacone dane i zapytanie użytkownika[15]. Niektóre modele mogą korzystać z innych technik wzbogacania odpowiedzi[13].
Przypisy
[edytuj | edytuj kod]- ↑ Leandro von Werra , Lewis Tunstall , Thomas Wolf , Przetwarzanie języka naturalnego z wykorzystaniem transformerów: budowanie aplikacji językowych za pomocą bibliotek Hugging Face, Grzegorz Werner (tłum.), Gliwice: Helion, 2024, s. 206, ISBN 978-83-289-0711-9 [dostęp 2025-04-16] .
- ↑ Krzysztof Klimczyk , Aplikacja wspomagająca tworzenie serwerów urządzeń w środowisku Tango Controls [online], 25 listopada 2024 [dostęp 2025-04-12] .
- ↑ Adam Karolewski , Sztuczna inteligencja w poszukiwaniu wiedzy, „Biuletyn EBIB” (213), 22 maja 2024, ISSN 1507-7187 [dostęp 2025-04-12] (pol.).
- ↑ What is retrieval-augmented generation (RAG)? [online], IBM Research, 9 lutego 2021 [dostęp 2025-04-12] (ang.).
- ↑ Maciej Kaszkowiak , RAG, czyli jak rozmawiać z naszymi dokumentami? [online], kaszkowiak.org, 20 grudnia 2023 [dostęp 2025-04-12] (pol.).
- ↑ a b Why Google's AI Overviews gets things wrong. MIT Technology Review, 31 May 2024. [dostęp 7 March 2025].
- ↑ Rahul Singhal: The Power Of RAG: How Retrieval-Augmented Generation Enhances Generative AI. Forbes, Nov 30, 2023.
- ↑ Tianyu Gao i inni, Enabling Large Language Models to Generate Text with Citations, arXiv, 31 października 2023, DOI: 10.48550/arXiv.2305.14627 [dostęp 2025-04-12] .
- ↑ Kevin Wu i inni, How well do LLMs cite relevant medical references? An evaluation framework and analyses, arXiv, 3 lutego 2024, DOI: 10.48550/arXiv.2402.02008 [dostęp 2025-04-12] .
- ↑ Patrick Lewis i inni, Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, arXiv, 12 kwietnia 2021, DOI: 10.48550/arXiv.2005.11401 [dostęp 2025-04-12] .
- ↑ Rahul Singhal , The Power Of RAG: How Retrieval-Augmented Generation Enhances Generative AI [online], Forbes [dostęp 2025-04-12] (ang.).
- ↑ Xiaohua Wang i inni, Searching for Best Practices in Retrieval-Augmented Generation, arXiv, 1 lipca 2024, DOI: 10.48550/arXiv.2407.01219 [dostęp 2025-04-13] .
- ↑ a b Penghao Zhao i inni, Retrieval-Augmented Generation for AI-Generated Content: A Survey, arXiv, 21 czerwca 2024, DOI: 10.48550/arXiv.2402.19473 [dostęp 2025-04-12] .
- ↑ Understanding Retrieval-Augmented Generation: Part 1 [online], www.bentoml.com [dostęp 2025-04-12] (ang.).
- ↑ Patrick Lewis i inni, Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, arXiv, 12 kwietnia 2021, DOI: 10.48550/arXiv.2005.11401 [dostęp 2025-04-13] .