Retrieval-augmented generation

Generowanie wspomagane wyszukiwaniem^[1], ang. retrieval-augmented generation^[2]^[3] (RAG) – technika umożliwiająca modelom GenAI wyszukiwanie i włączanie nowych, zewnętrznych informacji^[4]^[5]. RAG modyfikuje zapytania do dużego modelu językowego (LLM) tak, aby odpowiadał on na pytania użytkowników z uwzględnieniem dodatkowych, dołączonych danych^[6]. Umożliwia to LLM-om korzystanie z informacji specyficznych dla danej dziedziny i/lub zaktualizowanych^[6]^[7].

Oprócz zwiększenia jakości zwracanych odpowiedzi, RAG pozwala również LLM-om na uwzględnianie w generowanych treściach odniesień do źródeł, co umożliwia użytkownikom weryfikację informacji poprzez analizę cytowanych dokumentów lub oryginalnych źródeł. Dzięki temu możliwe jest uzyskanie większej wiarygodności i transparentność, ponieważ użytkownicy mogą sprawdzać pobrane treści, aby upewnić się co do ich dokładności, trafności i pochodzenia^[8]^[9].

Termin RAG został po raz pierwszy wprowadzony w 2020 r. przez Meta^[10]^[11]. Istnieją biblioteki umożliwiające wdrożenie technik RAG wraz z ich specyficznymi funkcjonalnościami^[12].

Proces

RAG składa się z czterech elementów^[13]:

Indexing (pol. indeksowanie) – dodatkowe dane dostarczane do systemu są osadzane i zapisywane w bazie danych^[14].
Retrieval (pol. pobieranie) – pobieranie najbardziej odpowiednich dokumentów dla danego zapytania.
Augmentation (pol. uzupełnianie) – przekazanie pobranych informacji do LLMa za pomocą inżynierii podpowiedzi.
Generation (pol. generowanie) – LLM zwraca odpowiedź w oparciu o wzbogacone dane i zapytanie użytkownika^[15]. Niektóre modele mogą korzystać z innych technik wzbogacania odpowiedzi^[13].

Przypisy

↑ Leandro vonL. Werra Leandro vonL., LewisL. Tunstall LewisL., ThomasT. Wolf ThomasT., Przetwarzanie języka naturalnego z wykorzystaniem transformerów: budowanie aplikacji językowych za pomocą bibliotek Hugging Face, GrzegorzG. Werner (tłum.), Gliwice: Helion, 2024, s. 206, ISBN 978-83-289-0711-9 [dostęp 2025-04-16] .
↑ KrzysztofK. Klimczyk KrzysztofK., Aplikacja wspomagająca tworzenie serwerów urządzeń w środowisku Tango Controls [online], 25 listopada 2024 [dostęp 2025-04-12] .
↑ AdamA. Karolewski AdamA., Sztuczna inteligencja w poszukiwaniu wiedzy, „Biuletyn EBIB” (213), 22 maja 2024, ISSN 1507-7187 [dostęp 2025-04-12] (pol.).
↑ What is retrieval-augmented generation (RAG)? [online], IBM Research, 9 lutego 2021 [dostęp 2025-04-12] (ang.).
↑ MaciejM. Kaszkowiak MaciejM., RAG, czyli jak rozmawiać z naszymi dokumentami? [online], kaszkowiak.org, 20 grudnia 2023 [dostęp 2025-04-12] (pol.).
↑ ^a ^b Why Google's AI Overviews gets things wrong. MIT Technology Review, 31 May 2024. [dostęp 7 March 2025].
↑ Rahul Singhal: The Power Of RAG: How Retrieval-Augmented Generation Enhances Generative AI. Forbes, Nov 30, 2023.
↑ TianyuT. Gao TianyuT. i inni, Enabling Large Language Models to Generate Text with Citations, arXiv, 31 października 2023, DOI: 10.48550/arXiv.2305.14627 [dostęp 2025-04-12] .
↑ KevinK. Wu KevinK. i inni, How well do LLMs cite relevant medical references? An evaluation framework and analyses, arXiv, 3 lutego 2024, DOI: 10.48550/arXiv.2402.02008 [dostęp 2025-04-12] .
↑ PatrickP. Lewis PatrickP. i inni, Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, arXiv, 12 kwietnia 2021, DOI: 10.48550/arXiv.2005.11401 [dostęp 2025-04-12] .
↑ RahulR. Singhal RahulR., The Power Of RAG: How Retrieval-Augmented Generation Enhances Generative AI [online], Forbes [dostęp 2025-04-12] (ang.).
↑ XiaohuaX. Wang XiaohuaX. i inni, Searching for Best Practices in Retrieval-Augmented Generation, arXiv, 1 lipca 2024, DOI: 10.48550/arXiv.2407.01219 [dostęp 2025-04-13] .
↑ ^a ^b PenghaoP. Zhao PenghaoP. i inni, Retrieval-Augmented Generation for AI-Generated Content: A Survey, arXiv, 21 czerwca 2024, DOI: 10.48550/arXiv.2402.19473 [dostęp 2025-04-12] .
↑ Understanding Retrieval-Augmented Generation: Part 1 [online], www.bentoml.com [dostęp 2025-04-12] (ang.).
↑ PatrickP. Lewis PatrickP. i inni, Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, arXiv, 12 kwietnia 2021, DOI: 10.48550/arXiv.2005.11401 [dostęp 2025-04-13] .

[1] Leandro vonL. Werra Leandro vonL., LewisL. Tunstall LewisL., ThomasT. Wolf ThomasT., Przetwarzanie języka naturalnego z wykorzystaniem transformerów: budowanie aplikacji językowych za pomocą bibliotek Hugging Face, GrzegorzG. Werner (tłum.), Gliwice: Helion, 2024, s. 206, ISBN 978-83-289-0711-9 [dostęp 2025-04-16] .

[2] KrzysztofK. Klimczyk KrzysztofK., Aplikacja wspomagająca tworzenie serwerów urządzeń w środowisku Tango Controls [online], 25 listopada 2024 [dostęp 2025-04-12] .

[3] AdamA. Karolewski AdamA., Sztuczna inteligencja w poszukiwaniu wiedzy, „Biuletyn EBIB” (213), 22 maja 2024, ISSN 1507-7187 [dostęp 2025-04-12] (pol.).

[4] What is retrieval-augmented generation (RAG)? [online], IBM Research, 9 lutego 2021 [dostęp 2025-04-12] (ang.).

[5] MaciejM. Kaszkowiak MaciejM., RAG, czyli jak rozmawiać z naszymi dokumentami? [online], kaszkowiak.org, 20 grudnia 2023 [dostęp 2025-04-12] (pol.).

[:2-6] Why Google's AI Overviews gets things wrong. MIT Technology Review, 31 May 2024. [dostęp 7 March 2025].

[:4-7] Rahul Singhal: The Power Of RAG: How Retrieval-Augmented Generation Enhances Generative AI. Forbes, Nov 30, 2023.

[8] TianyuT. Gao TianyuT. i inni, Enabling Large Language Models to Generate Text with Citations, arXiv, 31 października 2023, DOI: 10.48550/arXiv.2305.14627 [dostęp 2025-04-12] .

[9] KevinK. Wu KevinK. i inni, How well do LLMs cite relevant medical references? An evaluation framework and analyses, arXiv, 3 lutego 2024, DOI: 10.48550/arXiv.2402.02008 [dostęp 2025-04-12] .

[10] PatrickP. Lewis PatrickP. i inni, Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, arXiv, 12 kwietnia 2021, DOI: 10.48550/arXiv.2005.11401 [dostęp 2025-04-12] .

[11] RahulR. Singhal RahulR., The Power Of RAG: How Retrieval-Augmented Generation Enhances Generative AI [online], Forbes [dostęp 2025-04-12] (ang.).

[12] XiaohuaX. Wang XiaohuaX. i inni, Searching for Best Practices in Retrieval-Augmented Generation, arXiv, 1 lipca 2024, DOI: 10.48550/arXiv.2407.01219 [dostęp 2025-04-13] .

[:0-13] PenghaoP. Zhao PenghaoP. i inni, Retrieval-Augmented Generation for AI-Generated Content: A Survey, arXiv, 21 czerwca 2024, DOI: 10.48550/arXiv.2402.19473 [dostęp 2025-04-12] .

[14] Understanding Retrieval-Augmented Generation: Part 1 [online], www.bentoml.com [dostęp 2025-04-12] (ang.).

[15] PatrickP. Lewis PatrickP. i inni, Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, arXiv, 12 kwietnia 2021, DOI: 10.48550/arXiv.2005.11401 [dostęp 2025-04-13] .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]