süni intellektai-agentlərillmtəcili mühəndislikmaşın öyrənməsi
Süni İntellekt Agentlərində Statik Çıxış Yaradılmasına Qarşı Özünü Əks Etmə
Süni intellekt agentlərində özünü əks etdirmə təkrarlanan mühakimə yürütmə, səhvlərin düzəldilməsi və adaptiv davranışa imkan verir, statik çıxış generasiyası isə daxili yoxlama olmadan sabit cavablar yaradır. Əks etdirmə yanaşması mürəkkəb tapşırıqlarda daha yüksək dəqiqlik və kontekstual məlumatlılıq üçün sürət və hesablama xərclərini dəyişdirir.
Seçilmişlər
Özünü əks etdirən agentlər şifahi özünütənqid vasitəsilə öz nəticələrini təkmilləşdirə bilərlər, statik nəsildə isə tamamilə çatışmayan qabiliyyət.
Statik generasiya əks olunma dövrünü atladığı üçün hər sorğu üçün təxminən üç-beş dəfə ucuzdur.
HumanEval kimi etalonlar, əsas modelin üzərinə əks etdirmə əlavə edildikdə mənalı dəqiqlik qazancları göstərir.
Əks etdirici sistemlər sessiyalar boyunca davamlı yaddaş yarada bilər, statik sistemlər isə statussuz qalır.
Süni İntellekt Agentlərində Özünü Təhlil nədir?
Agentlərin yekun cavab verməzdən əvvəl öz nəticələrini təkrarlanan əsaslandırma dövrələri vasitəsilə qiymətləndirdiyi və yenidən nəzərdən keçirdiyi süni intellekt yanaşması.
Özünü əks etdirmə, 2023-cü ildə Shinn və digərləri tərəfindən təqdim edilən Reflexion çərçivəsi ilə populyarlaşdı və bu çərçivə şifahi möhkəmləndirmənin kodlaşdırma və mühakimə meyarlarında agent performansını yaxşılaşdıra biləcəyini göstərdi.
Bu texnika adətən ilkin cavabın yaradılmasını, tənqid edilməsini və tez-tez düşüncə zəncirindən istifadə edərək təkmilləşdirilmiş bir versiyanın hazırlanmasını əhatə edir.
Özünü əks etdirən GPT-4 kimi modellər, tək ötürücülü generasiya ilə müqayisədə HumanEval və GSM8K kimi etalonlarda ölçülə bilən qazanclar nümayiş etdirib.
Özünü əks etdirən vasitələr, sessiyalar boyunca öyrənilən dərsləri yadda saxlayaraq gələcək qərarları formalaşdıran bir növ epizodik yaddaş qura bilər.
Bu yanaşma, insanın metakognisiyasından ilham alır, burada insanın öz düşüncəsi haqqında düşünməsi problem həll etmə nəticələrini yaxşılaşdırır.
Statik Çıxış Yaranması nədir?
Heç bir daxili baxış və ya düzəliş olmadan tək bir irəli ötürmədə tək bir cavab yaradan ənənəvi süni intellekt generasiya metodu.
Statik generasiya, bir sorğu verildikdə əksər dil modellərinin standart davranışıdır və tamamlanana qədər çıxış token-token istehsal edir.
Bu, yalnız bir nəticə çıxarma çağırışı tələb edir ki, bu da onu çoxmərhələli əks etdirmə yanaşmalarından xeyli sürətli və ucuz edir.
Statik çıxışlar sıfır temperaturda deterministikdir, yəni eyni girişlər etibarlı şəkildə eyni çıxışlar yaradır.
Bu metod, neyron dil modellərinin ilk günlərindən bəri çatbotlar, tərcümə vasitələri və məzmun generatorları da daxil olmaqla saysız-hesabsız istehsal sistemlərinə güc vermişdir.
Özünüdüzəltmə mexanizmləri olmadan statik nəsil inamla halüsinasiyalar və ya aşkarlanmayan faktiki səhvlər yarada bilər.
Müqayisə Cədvəli
Xüsusiyyət
Süni İntellekt Agentlərində Özünü Təhlil
Statik Çıxış Yaranması
Nəsil Metodu
Özünüqiymətləndirmə dövrələri ilə təkrarlanan
Tək irəli ötürmə, daxili baxış yoxdur
Mürəkkəb Tapşırıqlarda Dəqiqlik
Xüsusilə də düşüncə meyarlarında daha yüksək
Çoxmərhələli məsələlərdə daha aşağı
Hesablama Xərci
Hər sorğu üçün birdən çox nəticə çıxarma çağırışı
Hər sorğu üçün bir nəticə çıxarma çağırışı
Cavab Gecikməsi
Əks olunma dövrlərinə görə daha yavaş
Sürətli, demək olar ki, real vaxt çıxışı
Xəta Düzəlişi
Daxili tənqid və düzəliş mərhələsi
Daxili korreksiya mexanizmi yoxdur
Yaddaş İnteqrasiyası
Gələcək istifadə üçün əks etdirmələri saxlaya bilər
Sorğular üzrə vətəndaşlığı olmayan
Ən Yaxşı İstifadə Halları
Kodlaşdırma, riyaziyyat, tədqiqat, kompleks planlaşdırma
Sadə sual-cavab, tərcümə, xülasə
Tətbiq Mürəkkəbliyi
Sürətli mühəndislik və orkestrləşdirmə tələb edir
Sadə tək sürətli dizayn
Ətraflı Müqayisə
Düşünmə və Problem Həlli
Özünü əks etdirən agentlər riyazi söz məsələlərinin həlli və ya kodda səhvlərin aradan qaldırılması kimi çoxmərhələli mühakimə yürütmə tələb edən tapşırıqlarda parlaq şəkildə çalışırlar. Öz işlərini qiymətləndirmək üçün fasilə verərək, tək keçidli modelin qaçıracağı məntiqi boşluqları aşkar edirlər. Statik generasiya sadə sorğuları yaxşı həll edir, lakin problem bir neçə addım irəli planlaşdırmağı tələb etdikdə büdrəməyə meyllidir və tez-tez inamlı səslənən, lakin gizli səhvləri olan cavablar verir.
Sürət və Resurs Səmərəliliyi
Statik çıxış generasiyası sürət və xərc baxımından qəti şəkildə qalib gəlir. Tək bir nəticə çıxarma çağırışı, əks etdirici döngənin istehlak etdiyi tokenlərin müəyyən bir hissəsindən istifadə edir ki, bu da miqyasda çox vacibdir. Özünü əks etdirmə adətən hər sorğu üçün üç-beş dəfə çox hesablama tələb edir ki, bu da tez bir təxmini cavabın kifayət etdiyi yüksək həcmli, aşağı riskli qarşılıqlı təsirlər üçün praktik deyil.
Etibarlılıq və Xətaların İdarə Edilməsi
Əks etdirici sistemlər istifadəçi səhvlərini görməzdən əvvəl öz səhvlərini müəyyən edə və düzəldə bilər ki, bu da istehsalda utancverici halüsinasiyaları kəskin şəkildə azaldır. Statik generasiyanın belə bir təhlükəsizlik şəbəkəsi yoxdur, buna görə də hər hansı bir səhv birbaşa son istifadəçiyə ötürülür. Bununla belə, özünü əks etdirmə qüsursuz deyil; bir model, tənqidi addımı zəif dizayn edildiyi təqdirdə, öz səhv fərziyyələrini inamla gücləndirə bilər.
Zamanla Yaddaş və Öyrənmə
Qabaqcıl refleksiv agentlər seanslar boyunca anlayışları qoruyub saxlaya, nəyin işlədiyini və nəyin işləmədiyini öyrənə bilər. Bu, statik sistemlərin sadəcə uyğunlaşdıra bilmədiyi mürəkkəbləşdirici təkmilləşdirmə effekti yaradır. Statik generasiya hər bir sualı təcrid olunmuş bir hadisə kimi qəbul edir və bu da davranışı proqnozlaşdırıla bilən saxlayır, lakin hər hansı bir toplanmış öyrənmə formasının qarşısını alır.
Tətbiq və Texniki Xidmət
Özünü əks etdirmənin qurulması, tez-tez ayrı-ayrı tənqidçi və revizor təkliflərini, üstəgəl dövrü idarə etmək üçün orkestrləşdirmə məntiqini əhatə edən diqqətli təklif dizaynını tələb edir. Statik generasiya, adətən yalnız tək bir yaxşı hazırlanmış təklifdən ibarət olduqca sadədir. ML mühəndislik resursları olmayan komandalar üçün statik generasiyanın sadəliyi əks etdirmənin dəqiqlik faydalarını üstələyir.
Üstünlüklər və Eksikliklər
Süni İntellekt Agentlərində Özünü Təhlil
Üstünlüklər
+Daha yüksək dəqiqlik
+Özünü düzəldən
+Daimi yaddaş
+Daha yaxşı düşüncə
Saxlayıcı
−Daha yüksək qiymət
−Daha yavaş cavablar
−Mürəkkəb quraşdırma
−Səhvləri gücləndirə bilər
Statik Çıxış Yaranması
Üstünlüklər
+Sürətli çıxış
+Aşağı qiymət
+Tətbiq etmək asandır
+Proqnozlaşdırıla bilən davranış
Saxlayıcı
−Səhv düzəlişi yoxdur
−Halüsinasiyalara meylli
−Vətəndaşlığı olmayan
−Zəif düşüncə
Yaygın yanlış anlaşılmalar
Əfsanə
Özünü əks etdirmə həmişə süni intellekt nəticələrini daha dəqiq edir.
Həqiqət
Refleksiya mühakimə yürütmə tapşırıqlarında əhəmiyyətli dərəcədə kömək edir, lakin tənqidi addım zəif dizayn edilibsə, mövcud qərəzləri gücləndirə və ya səhv cavabları inamla gücləndirə bilər. Refleksiyanın keyfiyyəti modelin əsas imkanlarından və onu istiqamətləndirmək üçün istifadə olunan göstərişlərdən çox asılıdır.
Əfsanə
Süni intellekt agentləri dövründə statik generasiya artıq köhnəlmişdir.
Həqiqət
Statik generasiya, sürət və maya dəyərinin mükəmməl dəqiqlikdən daha vacib olduğu saysız-hesabsız istehsal sistemlərinin əsasını təşkil edir. Əksər çatbotlar, tərcüməçilər və xülasəçilər hələ də tək keçidli generasiyaya əsaslanırlar, çünki kompromislər sadəliyə üstünlük verir.
Əfsanə
Özünü əks etdirmə, süni intellektin əslində şüurlu və ya məlumatlı olması deməkdir.
Həqiqət
Süni intellektdə özünü əks etdirmə şüur deyil, hesablama nümunəsidir. Model metakognisiyanı təqlid edən, lakin heç bir subyektiv təcrübə və ya həqiqi özünüdərk demək olmayan öz əvvəlki çıxışı haqqında mətn yaradır.
Əfsanə
Daha çox əks etdirmə dövrü həmişə daha yaxşı nəticələrə gətirib çıxarır.
Həqiqət
Azalan gəlir tez bir zamanda özünü göstərir və həddindən artıq əks olunma modelin sadə problemləri həddindən artıq düşünməsinə və ya orijinal tapşırıqdan uzaqlaşmasına səbəb ola bilər. Ən uğurlu tətbiqlər limitsiz iterasiya əvəzinə bir-üç əks olunma dövründən istifadə edir.
Əfsanə
Statik nəsil düşüncə zəncirindən istifadə edə bilməz.
Həqiqət
Fikir zəncirinə əsaslanan motivasiya statik nəsil ilə tam uyğundur. Model tək bir cavab daxilində addım-addım səbəblər təqdim edir, lakin əsl özünü əks etdirmədən əsas fərq olan bu mülahizəni tənqid etmək və ya yenidən nəzərdən keçirməklə dayanmır.
Tez-tez verilən suallar
Süni intellekt agentlərində özünü əks etdirmə nədir?
Özünü əks etdirmə, süni intellekt agentinin ilkin cavab yaratdığı, səhvlər və ya təkmilləşdirmələr üçün qiymətləndirdiyi və sonra yenidən işlənmiş bir versiya hazırladığı bir texnikadır. Reflexion və CRITIC kimi çərçivələr bu yanaşmanı populyarlaşdırdı və kodlaşdırma və riyazi etalonlarda ölçülə bilən qazanclar göstərdi. Agent, son cavabı verməzdən əvvəl əsasən öz işini tənqid edir.
Statik çıxış generasiyası necə işləyir?
Statik çıxış generasiyası, dil modelinə bir sorğu göndərməklə və tamamlanana qədər ardıcıl olaraq tokenlər yaratmasına icazə verməklə işləyir. Daxili baxış mərhələsi yoxdur, buna görə də ilk cavab son cavabdır. Bu, GPT, Claude və Llama kimi modellərin heç bir agent iskele olmadan istifadə edildikdə standart davranışıdır.
Hansı yanaşma daha dəqiqdir?
Özünürefleksləşdirmə, ümumiyyətlə, mürəkkəb düşünmə tapşırıqları üzrə daha dəqiq nəticələr verir. GSM8K və HumanEval kimi etalonlar üzrə tədqiqatlar, refleksləşdirmə əlavə edildikdə dəqiqliyin 5-20 faiz arasında artdığını göstərir. Lakin sadə faktiki sorğular üçün hər iki yanaşma demək olar ki, eyni şəkildə işləyir.
Özünü əks etdirmə statik generasiyadan daha bahadırmı?
Bəli, əhəmiyyətli dərəcədə belədir. Əks etdirici döngə adətən tək keçidli cavabdan üç-beş dəfə çox token tələb edir ki, bu da birbaşa daha yüksək API xərclərinə və daha yavaş cavab müddətlərinə səbəb olur. Yüksək həcmli tətbiqlər üçün bu xərc fərqi həddindən artıq ola bilər.
Hər iki yanaşmanı birləşdirə bilərsinizmi?
Əlbəttə. Bir çox istehsal sistemi gündəlik sorğular üçün statik generasiyadan istifadə edir və yalnız tapşırıq mürəkkəb olduqda və ya ilkin etibar aşağı olduqda əks etdirməni işə salır. Bu hibrid yanaşma, hər bir sorğu üçün əks etdirmə xərcləri ödəmədən hər iki dünyanın ən yaxşısını əldə edərək, xərc və dəqiqliyi tarazlaşdırır.
Özünütəhlil üçün məşhur çərçivələr hansılardır?
2023-cü ildə təqdim edilən Refleksiyon, erkən təsirli bir çərçivə idi. Digərlərinə Özünü Təkmilləşdirmə, Tənqid və LangChain və LangGraph-dakı müxtəlif agent nümunələri daxildir. Hər biri əks olunmaları saxlamaq və nə vaxt yenidən nəzərdən keçirəcəyinizə qərar vermək üçün bir qədər fərqli mexanizmlər təklif edir.
Özünü əks etdirmə açıq mənbəli modellərlə işləyirmi?
Bəli, effektivlik baza modelinin mühakimə qabiliyyətindən asılıdır. Llama 3.1 70B və ya Qwen 2.5 kimi daha güclü modellər, bəzən faydalı özünütənqid yaratmaqda çətinlik çəkən kiçik 7B modellərinə nisbətən əks etdirmədən daha çox faydalanır. Texnika prinsipcə modelə aqnostikdir.
Özünüqiymətləndirmədən nə vaxt çəkinməliyəm?
Gecikmə kritik olduqda, tapşırıq sadə olduqda və ya sorğu başına düşən xərcin minimum səviyyədə qalması lazım olduqda əks olunmanı atlayın. Real vaxt tərcüməsi, avtomatik tamamlama təklifləri və yüksək həcmli müştəri xidmətləri botları statik generasiyanın daha yaxşı seçim olaraq qaldığı klassik hallardır.
Öz süni intellekt sistemimdə özünü əks etdirməni necə tətbiq edə bilərəm?
İlkin cavab yaradan əsas sorğu ilə başlayın, sonra modeldən həmin cavabı səhvlərə görə tənqid etməsini xahiş edən ikinci sorğu və nəhayət, yenidən işlənmiş versiyanı yaradan üçüncü sorğu əlavə edin. LangChain, LlamaIndex və DSPy kimi alətlər xüsusi kod yazmadan bu orkestrləşdirməni sadələşdirir.
Özünü əks etdirmə süni intellekt agentlərini şüurlu edəcəkmi?
Xeyr. Süni intellektdə özünü əks etdirmə, şüurun və ya həqiqi özünüdərk dəlili deyil, əvvəlki nəticələr haqqında mətn yaratmaq nümunəsidir. Bu, insan metakognisiyasının aspektlərini təqlid edən faydalı bir mühəndislik texnikasıdır, lakin modelin heç bir daxili təcrübəsini nəzərdə tutmur.
Hökm
Süni intellekt agentlərində mürəkkəb mühakimə tapşırıqlarında dəqiqlik sürət və ya xərcdən daha vacib olduqda, məsələn, kodlaşdırma köməkçilərində, tədqiqat alətlərində və ya muxtar planlaşdırma sistemlərində özünüqiymətləndirməni seçin. Müştəri dəstəyi chatbotları, tərcümə və ya təsadüfi səhvlərin aşağı olduğu sadə məzmun yaradılması kimi yüksək həcmli, gecikməyə həssas tətbiqlər üçün statik çıxış generasiyasından istifadə edin.