Memahami Retrieval Augmented Generation (RAG) Melalui Rencana Pembangunan LaporMacet.com
LaporMacet.com adalah sebuah ide awal untuk membangun sebuah platform yang bisa memberikan informasi lalu lintas terkini kepada pengguna berdasarkan pertanyaan dalam bahasa alami. Misalnya, pengguna bisa bertanya “Apakah jalan Gatsu saat ini lancar?” dan mendapatkan jawaban otomatis apakah jalan tersebut sedang macet atau lancar.
Platform ini rencananya akan dibangun dengan menerapkan konsep Retrieval Augmented Generation (RAG). RAG adalah pendekatan di mana sebuah model AI dilatih untuk menggabungkan kemampuan retrieval/pencarian informasi eksternal dan kemampuan generate/membangkitkan teks.
Retrieval augmented generation adalah sebuah pendekatan dalam pembuatan model AI yang dapat menghasilkan teks yang menggabungkan kemampuan retrieval (pengambilan informasi) dan generation (pembangkitan teks).
Beberapa fitur utama dari retrieval augmented generation:
1. Mengambil informasi relevan dari sumber data eksternal (seperti basis data fakta, artikel, dan lainnya) untuk memperkaya konten yang dihasilkan. Hal ini memungkinkan model untuk menghasilkan teks dengan informasi akurat dan up-to-date.
2. Informasi yang diambil kemudian digunakan untuk membimbing proses generate teks. Sehingga output teks yang dihasilkan relevan dengan topik yang diminta dan berisi fakta-fakta akurat.
3. Biasanya selain mengambil informasi faktual, model retrieval augmented juga mengambil contoh teks relevan dari dataset. Contoh teks ini kemudian digunakan model sebagai bahan acuan untuk menghasilkan teks baru, sehingga gaya bahasa dan struktur kalimat menjadi lebih natural.
4. Menghasilkan teks dengan kualitas yang lebih baik dan akurat dibandingkan model generatif teks murni, karena didukung oleh komponen retrieval di dalam sistemnya.
Jadi secara ringkas, retrieval augmented generation adalah penggabungan kemampuan mengambil informasi dan menghasilkan teks sehingga bisa menghasilkan output teks dengan kualitas tinggi.
Dengan RAG, model AI tidak hanya mengandalkan pengetahuan yang sudah ada di dalam dirinya, tetapi juga bisa mengambil informasi terbaru dari sumber-sumber eksternal seperti basis data lalu lintas, kemudian informasi tersebut digunakan untuk membimbing proses generate jawaban.
Manfaat dari penerapan RAG antara lain meningkatkan akurasi, kemutakhiran dan kesesuaian jawaban terhadap konteks pertanyaan pengguna. Selain itu, gaya bahasa jawaban juga bisa disesuaikan agar lebih natural.
Namun, ada beberapa tantangan yang perlu diatasi dalam mewujudkan LaporMacet.com, antara lain:
1. Perlunya mendapatkan akses ke data lalu lintas real-time yang selalu update. Saat ini menggunakan google maps dan Waze.
2. Mencocokkan pertanyaan alami user ke dataset yang tersedia membutuhkan algoritma canggih. Ini bisa menggunakan embedding.
3. Membutuhkan model AI generatif terbaru agar bisa mengenerate jawaban yang berkualitas. Pilihannya adalah GTP3.5 dan GPT4.0.
4. Masih terbuka kemungkinan gagal karena sudah ada aplikasi seperti Google Maps dan Waze.
Meski penuh tantangan, LaporMacet.com tetap berupaya dikembangkan karena potensi dan peluang penerapan RAG yang dibuka cukup menjanjikan, seperti memberikan pengalaman interaksi baru bagi pengguna dalam mencari info lalu lintas. Selain itu, project ini bisa menjadi batu loncatan pembelajaran penerapan RAG untuk kasus lainnya di masa mendatang.