Comparthing Logo
kiekybinė analizėalgoritminė prekybaduomenų mokslasanalitika

Pernelyg didelis investavimo modelių pritaikymas ir tvirtas strategijos dizainas

Pasirinkimas tarp perteklinio pritaikymo modelio ir tvirtos strategijos yra skirtumas tarp sistemos, kuri popieriuje atrodo tobulai, ir tokios, kuri iš tikrųjų išgyvena nenuspėjamą realių rinkų chaosą. Nors perteklinis pritaikymas sukuria „atsitiktinumo apgaunamų“ spąstus, vaikydamasis istorinio triukšmo, tvirtas dizainas orientuotas į ilgalaikius principus ir lankstumą.

Akcentai

  • Per didelis pritaikymas iš esmės yra praeities „pritaikymas prie kreivės“, kad ateitis atrodytų kaip tobula.
  • Tvirtumas matuojamas pagal tai, kaip gerai strategija išlieka, kai tikrinamos jos prielaidos.
  • Kuo sudėtingesnis modelis, tuo didesnė tikimybė, kad jis bus per daug pritaikytas.
  • Strategijos supaprastinimas realiame pasaulyje dažnai padidina jos pelningumą.

Kas yra Pernelyg pritaikyti investavimo modeliai?

Statistiniai modeliai, kurie pernelyg tiksliai pritaikyti konkrečiam praeities duomenų rinkiniui, fiksuojantys atsitiktinį triukšmą, o ne prasmingus rinkos signalus.

  • Paprastai rodo beveik idealų našumą atliekant atgalinius testus be jokių nuostolių.
  • Įtraukite per daug parametrų, kad „paaiškintumėte“ kiekvieną istorinį kainos svyravimą.
  • Beveik iš karto žlunga, kai susiduriama su realiais, imties neturinčiais rinkos duomenimis.
  • Remtis sudėtingais matematiniais modeliais, neturinčiais jokios pagrindinės ekonominės logikos.
  • Dažnai atsiranda dėl duomenų gavybos, kai tyrėjai tikrina tūkstančius kintamųjų, kol kažkas prilimpa.

Kas yra Tvirtas strategijos dizainas?

Prekybos sistemų kūrimo metodas, kuriame pirmenybė teikiama paprastumui ir struktūriniam vientisumui, siekiant užtikrinti našumą įvairiomis rinkos sąlygomis.

  • Naudoja minimalų kintamųjų skaičių, kad būtų išvengta statistinių anomalijų.
  • Demonstruoja nuoseklų našumą skirtingose turto klasėse ir laikotarpiuose.
  • Yra pagrįstas aiškia, paaiškinama ekonomine ar elgesio teorija.
  • Išlaiko savo efektyvumą net ir šiek tiek pakeitus įvesties parametrus.
  • Akcentuoja rizikos valdymą ir išlikimą, o ne teorinės grąžos maksimizavimą.

Palyginimo lentelė

Funkcija Pernelyg pritaikyti investavimo modeliai Tvirtas strategijos dizainas
Sudėtingumas Aukštas (pertekliniai parametrai) Žemas (tausus dizainas)
Atgalinio testavimo našumas Egzotiška, didelė grąža Vidutinė, reali grąža
Rinkos prisitaikymas Trapus Atsparus
Pagrindinė logika Grynai statistinis Ekonominis / elgesio
Kintamųjų skaičius Daug (daugiau nei 10 rodiklių) Nedaug (2–4 rodikliai)
Gedimo režimas Visiškas žlugimas Grakštus degradavimas
Dizaino filosofija Pritaikymas prie praeities Pasiruošimas ateičiai

Išsamus palyginimas

Tikrumo iliuzija

Pernelyg pritaikyti modeliai dažnai atrodo kaip „šventasis gralis“, nes jie buvo suderinti taip, kad idealiai atitiktų istorines diagramas. Tačiau šis tobulumas yra miražas; modelis iš esmės įsiminė seno testo atsakymus, o ne išmoko tikrąjį dalyką. Tvirtos strategijos priima mintį, kad ateitis atrodys kitaip nei praeitis, ir numato paklaidos ribą.

Parametro jautrumas

Tvirta strategija paprastai vis tiek veiks, jei 20 dienų slenkamąjį vidurkį pakeisite į 22 dienų slenkamąjį vidurkį, o tai parodys, kad pagrindinė idėja yra pagrįsta. Per daug pritaikyti modeliai yra žinomi dėl savo trapumo; jei jų nustatymuose pakoreguosite bent vieną tašką, visa našumo kreivė dažnai sugrius, įrodydama, kad sistema rėmėsi konkrečiu laimingų sutapimų rinkiniu.

Ekonominis fondas ir duomenų gavyba

Tvirtas dizainas prasideda nuo „kodėl“ – pavyzdžiui, idėjos, kad investuotojai per daug reaguoja į blogas naujienas. Duomenų gavyba prasideda nuo „ko“ – ieškant bet kokio rodiklių derinio, kuris netyčia pakilo. Be loginio pagrindo modelis tėra laimingas spėjimas, kuris labai tikėtinai žlugs, kai tik pasikeis rinkos režimai.

Ne imties našumas

Tikrasis bet kurios sistemos išbandymas yra tai, kaip ji tvarko anksčiau nematytus duomenis. Per daug pritaikyti modeliai žlunga, nes yra optimizuoti mokymo laikotarpio „triukšmui“. Tvirti modeliai siekia „einant į priekį“ efektyvumo, o tai reiškia, kad jie ir toliau fiksuoja platesnį „signalą“ net ir kintant konkrečiai rinkos aplinkai.

Privalumai ir trūkumai

Per daug pritaikyti modeliai

Privalumai

  • + Įspūdingi pasiūlymų rinkiniai
  • + Tobula istorinė matematika
  • + Didelis teorinis Šarpo rodiklis
  • + Užfiksuoja konkrečius režimus

Pasirinkta

  • Didelė žlugimo rizika
  • Nėra nuspėjamosios galios
  • Psichologiniai spąstai
  • Trapus vykdymas

Tvirtas dizainas

Privalumai

  • + Patikima prekyba realiuoju laiku
  • + Lengviau šalinti triktis
  • + Mažesnės apyvartos išlaidos
  • + Prisitaiko prie pokyčių

Pasirinkta

  • Mažesnė atgalinio testavimo grąža
  • Reikia daugiau kantrybės
  • Sunkiau parduoti klientams
  • Mažiau tikslus įėjimas/išėjimas

Dažni klaidingi įsitikinimai

Mitas

100 % laimėjimo rodiklis atliekant atgalinį testavimą yra geras ženklas.

Realybė

Tai iš tiesų yra didelis įspėjamasis ženklas. Jokia prekybos strategija nelaimi visada; idealus praeities testas beveik visada reiškia, kad modelis buvo specialiai užprogramuotas taip, kad būtų išvengta visų istorinių nuostolių, todėl jis tampa nenaudingas ateities įvykiams.

Mitas

Mašininio mokymosi naudojimas natūraliai padeda išvengti per didelio pritaikymo.

Realybė

Šiuolaikiniai dirbtinio intelekto ir neuroniniai tinklai iš tikrųjų yra labiau linkę į perteklinį pritaikymą nei paprasti tiesiniai modeliai. Be tokių metodų kaip reguliavimas ar iškritimas, šie modeliai yra itin geri randant atsitiktinio triukšmo modelius.

Mitas

Pridėjus daugiau indikatorių, modelis tampa tikslesnis.

Realybė

Kiekybiniuose finansuose mažiau paprastai yra daugiau. Kiekvienas papildomas rodiklis ar filtras, kurį pridedate, padidina tikimybę, kad jūs tiesiog susiaurinate savo modelį iki konkretaus istorinių datų rinkinio, kuris niekada nepasikartos.

Mitas

Sudėtingumas lygus rafinuotumui.

Realybė

Analizės sudėtingumas – tai nuolatinės tiesos nustatymas naudojant kuo paprastesnį įrankį. Sudėtingas modelis dažnai tiesiog slepia supratimo stoką už matematikos sienos.

Dažnai užduodami klausimai

Kaip sužinoti, ar mano prekybos strategija yra pernelyg pritaikyta?
Dažniausias požymis yra „našumo nuosmukis“ pereinant nuo mokymo duomenų prie išankstinio testo. Jei jūsų grąža gerokai sumažėja, kai testuojama nauju laikotarpiu, arba jei nedideli įvesties kriterijų pakeitimai sugadina rezultatus, greičiausiai matote pernelyg pritaikytą sistemą. Kitas rodiklis yra tai, kad vienam įvesties signalui yra daugiau nei 3 ar 4 kintamieji.
Kokia yra „laisvės laipsnių“ problema?
Tai reiškia ryšį tarp turimų duomenų kiekio ir jūsų modelyje esančių taisyklių skaičiaus. Jei jūsų istorijoje yra 100 sandorių, bet 20 skirtingų taisyklių jiems apibrėžti, turite labai mažai „laisvės laipsnių“. Iš esmės jūs taip susiaurinote duomenis, kad jūsų rezultatai nebėra statistiškai reikšmingi.
Kodėl kvantai kalba apie „triukšmą“ ir „signalą“?
„Signalas“ – tai pagrindinė tiesa arba tendencija, kuri iš tikrųjų keičia rinką, pavyzdžiui, palūkanų normų pokyčiai arba įmonių pelnas. „Triukšmas“ – tai atsitiktinis, nepastovus kainų judėjimas, kurį sukelia milijonai atskirų sandorių. Pernelyg pritaikyti modeliai triukšmą painioja su signalu, bandydami rasti prasmę tame, kas iš esmės yra atsitiktinis ėjimas.
Ar tiesioginė analizė (angl. Walk-Forward Analysis) yra geriausias būdas užtikrinti patikimumą?
Tai vienas geriausių prieinamų įrankių. Jis apima modelio optimizavimą duomenų segmente ir iš karto jį išbandymą kitame segmente. Perkeldami šį laikotarpį į priekį, imituojate, kaip modelis būtų iš tikrųjų veikęs kaip realus prekiautojas, o tai labai greitai atskleidžia perteklinį pritaikymą.
Ar tvirtas dizainas reiškia, kad turiu sutikti su mažesne grąža?
Nebūtinai ilgainiui, bet jūsų praeities testai tikrai atrodys mažiau įspūdingai. Tvirta strategija gali parodyti 15 % metinę grąžą su realiais nuosmukiais, o pernelyg pritaikyta – 50 % be jokių nuosmukių. Realioje prekyboje tvirta strategija greičiausiai ir toliau uždirbs 15 %, o pernelyg pritaikyta – greičiausiai praras pinigus.
Ar galiu naudoti „Okamo skustuvą“ savo analizėje?
Be abejo. Kalbant apie strategijos kūrimą, Occamo skustuvo teorija teigia, kad paprasčiausias paaiškinimas (arba modelis) paprastai yra geriausias. Jei savo sandorį galite paaiškinti vienu paprastos anglų kalbos sakiniu, jis daug labiau tikėtinas kaip patikimas strategija, kuriai pagrįsti reikia trijų puslapių formulių.
Kokį vaidmenį patikimumui atlieka „Monte Karlo“ modeliavimas?
Monte Karlo testai padeda pakeisti jūsų sandorių tvarką arba šiek tiek pakeisti kainas. Jei jūsų strategija remiasi tikslia 2023 m. įvykių seka, Monte Karlo testas jį sulaužys. Jei strategija atlaiko 1000 skirtingų atsitiktinių duomenų permaišymų, yra daug didesnė tikimybė, kad ji bus patikima.
Kaip „Parameter Heatmapping“ padeda išvengti per didelio pritaikymo?
Sukurdami rezultatų šilumos žemėlapį, apimantį įvairius nustatymus, galite ieškoti „stabilumo plokščiakalnių“. Jei jūsų strategija veikia tik esant tiksliai 14 periodų nustatymui, bet neveikia esant 13 ir 15 periodams, tas nustatymas yra „smaigalys“ ir greičiausiai per daug pritaikytas. Norite matyti platų pelningumo diapazoną, kuriame konkretus skaičius nėra labai svarbus.
Ar tvirta strategija laikui bėgant gali tapti „pernelyg pritaikyta“?
Techniškai ne, bet strategija gali nukentėti nuo „modelio degradacijos“. Tai atsitinka, kai pasikeičia rinkos struktūrinė realybė, pavyzdžiui, įvedamas naujas reglamentas arba pasikeičia prekybos valandos. Tai nėra perteklinis pritaikymas; tai tiesiog pradinio signalo išnykimas. Patikimas strategijas lengviau pritaikyti, kai taip nutinka, nes suprantate jų pagrindinę logiką.
Ar „kryžminis patvirtinimas“ naudingas investiciniams modeliams?
Taip, tai yra standartinė praktika, kai duomenys suskirstomi į kelis rinkinius ir modelis apmokomas / išbandomas su skirtingais deriniais. Jei modelis gerai veikia su visais pogrupiais, tai rodo, kad rasti modeliai yra universalūs duomenims, o ne būdingi tik vienam mėnesiui ar metams.

Nuosprendis

Rinkitės patikimą strategijos dizainą, jei norite sistemos, kuri galėtų susidoroti su realios prekybos neapibrėžtumu ir ilgainiui išsaugoti kapitalą. Per didelis pritaikymas yra pavojingas spąstas, kurio turėtų vengti kiekvienas rimtas analitikas, nes jis suteikia klaidingą saugumo jausmą, dėl kurio patiriami dideli nuostoliai.

Susiję palyginimai

Astrologinė prognozė ir statistinė prognozė

Astrologinės prognozės susieja dangaus ciklus su žmonių patirtimi siekiant simbolinės reikšmės, o statistinės prognozės analizuoja empirinius istorinius duomenis, kad įvertintų būsimas skaitines vertes. Šiame palyginime nagrinėjamas skirtumas tarp senovinės, archetipais pagrįstos asmeninių apmąstymų sistemos ir modernios, duomenimis pagrįstos metodologijos, naudojamos objektyviam sprendimų priėmimui versle ir moksle.

Astrologiniai tranzitai ir gyvenimo įvykių tikimybių modeliai

Šis palyginimas nagrinėja intriguojančią prarają tarp senovinių dangaus stebėjimų ir šiuolaikinės prognozinės analizės. Astrologiniai tranzitai naudoja planetų ciklus asmeninio augimo fazėms interpretuoti, o gyvenimo įvykių tikimybių modeliai remiasi dideliais duomenimis ir statistiniais algoritmais, kad numatytų konkrečius etapus, tokius kaip karjeros pokyčiai ar sveikatos priežiūros poreikiai.

Ateities prognozavimo modeliai ir retrospektyvi analizė

Nors retrospektyvinė analizė veikia kaip organizacijos galinio vaizdo veidrodis, analizuodama istorinius įrašus, kad suprastų praeities sėkmes ir nesėkmes, ateities prognozavimo modeliai žvelgia pro priekinį stiklą, derindami statistinius algoritmus ir mašininį mokymąsi, kad numatytų būsimus rinkos pokyčius, klientų veiksmus ir veiklos kliūtis.

Aukšto dažnio duomenys ir agreguoti duomenys modeliavime

Pasirinkimas tarp aukšto dažnio duomenų ir apibendrintų duomenų yra esminis kompromisas analitikoje. Nors neapdoroti, per sekundę gaunami sandoriai ir jutiklių srautai suteikia neprilygstamą tiesioginio elgesio ir rinkos mikrostruktūrų matomumą, suspausti laiko apibendrinimai pašalina didžiulį statistinį triukšmą ir didelius infrastruktūros poreikius, kad būtų galima atskleisti aiškias, struktūrines ilgalaikes tendencijas.

Automatinis modelio stebėjimas ir rankinis eksperimento stebėjimas

Pasirinkimas tarp automatinio modelių sekimo ir rankinio eksperimentų sekimo iš esmės lemia duomenų mokslo komandos greitį ir atkuriamumą. Nors automatizavimas naudoja specializuotą programinę įrangą, kad sklandžiai užfiksuotų kiekvieną hiperparametrą, metriką ir artefaktą, rankinis sekimas priklauso nuo žmogaus kruopštumo naudojant skaičiuokles arba „markdown“ failus, todėl reikia rasti griežtą kompromisą tarp sąrankos greičio ir ilgalaikio keičiamo tikslumo.