Il gioco è vietato ai minori di anni 18.
Giocare troppo può causare dipendenza patologica.
Pagina 5 di 7 PrimaPrima 1234567 UltimaUltima
Risultati da 81 a 100 di 122
Like Tree69Likes

Discussione: Poker bot battle (NLHE HU BOT vs top del mondo)

  1. #81
    Antonius L'avatar di yomik
    Registrato il
    Sep 2008
    Reputazione
    111
    Posts
    6,617
    Citato in
    726 Post(s)

    Predefinito

    Se ben ricordate quando Isildur apparve e ruppe il culo a tutti si disse che una delle sue move più spiazzanti fossero le overbet in nlhe.

    Cmq sono abbastanza "deluso" dal setup scelto dagli sviluppatori del bot. Le ore di gioco e la costanza di gioco richiesta è massacrante ed è uno dei motivi per cui molti reg compreso Polk hanno scelto di non prendere parte alla sfida.

    Non sto dicendo che agli umani sia scesa la catena dopo poco. Dico solo che con qualche mente brillante in più in termini di tecnica teorica ed orari più flessibili, forse avremmo assistito ad un confronto più livellato.
    idassegnato likes this.
    Chi ha assimilato il concetto di lungo periodo nel poker e lo applica alla vita reale, farà scelte sempre migliori degli altri; a volte il risultato sarà positivo a volte no, perchè come ho detto la varianza real life è molto + sick della varianza a poker; ma intanto costui saprà andare dritto sulla sua strada e nel long term avrà sempre ragione su chi basa le proprie scelte sui results immediati.

    My blog

    you can't climb the ladder of success with your hands in your pockets

  2. #82
    Fish
    Registrato il
    Apr 2014
    Località
    pioltello
    Reputazione
    0
    Posts
    24
    Citato in
    0 Post(s)
    Poker Nicks

    Predefinito


  3. #83
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1597
    Posts
    17,726
    Citato in
    2822 Post(s)

    Predefinito

    Citazione Originariamente Scritto da xplosive Visualizza Messaggio
    vorrei capire che edge abbia 100x a questo punto...

    comunque gli umani ormai disperati, stnano aprendo 6x da btn, quindi i result saranno un po' sfasati...

    se non sbaglio libratus runna su un pc molto performante, quindi prima che quella potenza di calcolo sia accessibile a tutti io direi almeno altri 3 o 4 anni(?) passeranno. per risolvere il giochino 6max io direi 1 anno al max (per superpc).

    insomma, se caragie mellon si rimangia la parola, l' online potrebbe finire molto presto..

    certo che uno che gioca in maniera stratosferica lo si nota abbastanza in fretta...
    Il bot runna su un supercomputer MA è stato detto dai ricercatori che su desktop renderebbe molto bene lo stesso.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  4. #84
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1597
    Posts
    17,726
    Citato in
    2822 Post(s)

    Predefinito

    Citazione Originariamente Scritto da conilmionome Visualizza Messaggio
    Di bot che girano ce ne sono parecchi, pokerstars sembra l'unica room un po' salva ancora, almeno il .it.
    I bot che giravano stile miss, thanatos, django e varie repliche come lumacalumaca etc.. sembrano eliminati per sempre.
    Però sospetto che in hu molti nuovi e continui nick stranieri possano essere dei bot.
    Però, per dire, su ipoker non è così, ormai è infestato dai bot e quelli top non sono mica così male, tralaltro ogni tot mesi cambiano un po' il gioco e migliorano di volta in volta.
    Poi anche lo stesso pokersnowie implementando la mini size ( prima aveva praticamente solo 1/2pot, pot, 2pot, ora ha anche 1/4 pot) a mio avviso è sicuramente tosto e giocandoci un po' a due anni di distanza mi ha sopreso. Sopreso perchè effettivamente fa un po' di cose simili a libratus, cioè dal nulla overpotta oppure minisize donkando etc.. Ti mette di continuo in difficoltà ecco.
    Comunque libratus oggi fa 12bb/100 vs i toptop, immagina quanti ne stampa vs reg bravi/decenti/scarsi etc..
    Poi credo che per pownare il 95% dei reg basti anche un bot bilanciato con 4-5 size differenti al massimo invece di 10-15. Non credo ci voglia per forza il bot della nasa, cioè il vecchio bot che ha perso 8bb/100 vs Polk and co, già pownava quasi tutti.

    Di sicuro le poker room, come dici te, non so come riescano a fermare i bot seriamente. Te l'avevi previsto già 3-4 anni fa, in realtà ci è voluto più del previsto, ma ho paura che si siamo.
    Attento quando pensi alle 12bb e le confronti con risultati reali, perchè sono senza rake, e questo può incidere tanto, e perchè sono 200x, mentre il gioco è normalmente 100x.

    Rimane ovviamente un numero pauroso ma un filo meno di quel che sembra se guardi solo alle 12bb.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  5. #85
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1597
    Posts
    17,726
    Citato in
    2822 Post(s)

    Predefinito

    Citazione Originariamente Scritto da yomik Visualizza Messaggio
    Se ben ricordate quando Isildur apparve e ruppe il culo a tutti si disse che una delle sue move più spiazzanti fossero le overbet in nlhe.

    Cmq sono abbastanza "deluso" dal setup scelto dagli sviluppatori del bot. Le ore di gioco e la costanza di gioco richiesta è massacrante ed è uno dei motivi per cui molti reg compreso Polk hanno scelto di non prendere parte alla sfida.

    Non sto dicendo che agli umani sia scesa la catena dopo poco. Dico solo che con qualche mente brillante in più in termini di tecnica teorica ed orari più flessibili, forse avremmo assistito ad un confronto più livellato.
    Isildur è un buon esempio anche perchè la sua edge aumentava da deep.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  6. #86
    Monkey Tilt L'avatar di ItaliaLOL
    Registrato il
    Feb 2011
    Località
    De puta madre
    Reputazione
    38
    Posts
    1,154
    Citato in
    149 Post(s)

    Predefinito

    Citazione Originariamente Scritto da Luciom Visualizza Messaggio
    Isildur è un buon esempio anche perchè la sua edge aumentava da deep.
    non è tanto la sua edge intrinseca che aumentava, ma l'EV stessa delle overbet in situazioni deep (o meglio, diminuisce l'EV di OPPO vs Overbet quando è OOP).
    Chapeau a lui per esserci arrivato allora ed aver crashato
    banditos and conilmionome like this.
    "Hi Ben I just have a basic question that is somewhat related to the concepts in the video, but also to poker overall. If you could only choose one thing to do to improve for the rest of your career what would it be?"

    Ben :"Become a computer"

  7. #87
    Fish
    Registrato il
    Apr 2016
    Reputazione
    0
    Posts
    14
    Citato in
    0 Post(s)

    Predefinito

    Non ho seguito nel dettaglio il test, però mi verrebbe da segnalare che c'è un'importante asimmetria informativa a favore del BOT. Voglio dire, il BOT è stato progettato immagino conoscendo lo stile di gioco "umano", mentre i giocatori non sapevano come avrebbe giocato Libratus. Anche un ottimo giocatore dal punto di vista tecnico non è detto che sia capace di trovare velocemente gli adattamenti ad una strategia (o insieme di strategie) sostanzialmente differente.

    Aggiungo che non sarei così "fiscale" con i 12bb100 (anche escludendo la varianza) perchè se vengono identificati alcuni leak importanti (come non saper gestire in modo ottimale size poco convenzionali), la correzione potrebbe portare a risultati sostanzialmente differenti. Questo accade anche tra umani.
    Ultima modifica di 2Big2Fail; 29-01-2017 alle 20:32

  8. #88
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1597
    Posts
    17,726
    Citato in
    2822 Post(s)

    Predefinito

    Citazione Originariamente Scritto da 2Big2Fail Visualizza Messaggio
    Non ho seguito nel dettaglio il test, però mi verrebbe da segnalare che c'è un'importante asimmetria informativa a favore del BOT. Voglio dire, il BOT è stato progettato immagino conoscendo lo stile di gioco "umano", mentre i giocatori non sapevano come avrebbe giocato Libratus. Anche un ottimo giocatore dal punto di vista tecnico non è detto che sia capace di trovare velocemente gli adattamenti ad una strategia (o insieme di strategie) sostanzialmente differente.

    Aggiungo che non sarei così "fiscale" con i 12bb100 (anche escludendo la varianza) perchè se vengono identificati alcuni leak importanti (come non saper gestire in modo ottimale size poco convenzionali), la correzione potrebbe portare a risultati sostanzialmente differenti. Questo accade anche tra umani.
    Hm mica sicuro di capire cosa intendi. Il bot è stato progettato risolvendo un tot di spot in senso GTO e giocando montecarlo. Cioè non è stato trainato su mani giocate tra umani, non ha basato il suo meccanismo di apprendimento sul come giocano gli umani.

    Per l'adattamento umano, tieni conto che parlano tra loro ogni giorno, 4 top pro che si scambiano note, read, etc.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  9. #89
    Fish
    Registrato il
    Apr 2016
    Reputazione
    0
    Posts
    14
    Citato in
    0 Post(s)

    Predefinito

    Mi sono informato un attimo ed in effetti è come dici, gli sviluppatori non sono partiti da alcuna strategia standard e non hanno "allenato" Libratus su di un database di mani giocate (ha imparato giocando da solo). Poi da quanto ho capito ci sono tutta una serie di aggiustamenti che è in grado di fare in game e post sessione credo in un'ottica exploitativa.
    Dalle interviste ai giocatori traspare che si sentono piuttosto battuti, e questo sembra essere dunque un risultato significativo.
    Restano tuttavia alcuni aspetti che secondo me possono influenzare la stima dell'atteso di Libratus vs umani:

    - perdere un centesimo o infinito è uguale in termini di vincite, trovandosi sotto i giocatori sono portati ad aumentare il profilo di rischio, quindi giocate potenzialmente non ottimali etc che abbassano l'atteso;
    - gli adattamenti potrebbero richiedere più di qualche giorno e più di 30K mani a testa (tra l'altro non so se hanno hand history a disposizione). Ho letto che stanno sperimentando strategie come open da bottone 6X...insomma, sembrano lavori in corso.
    - varianza. Le mani sono poche e anche accorgimenti come scambiare le carte non so quanto possano influire.

    Purtroppo per adesso questi test sono piuttosto costosi sia in termini di tempo che a livello economico. Sarebbe interessante vedere dei rematch dopo uno studio da parte degli umani delle mani giocate, e altri test di Libratus vs bot sviluppati secondo principi differenti.

  10. #90
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1597
    Posts
    17,726
    Citato in
    2822 Post(s)

    Predefinito

    Citazione Originariamente Scritto da 2Big2Fail Visualizza Messaggio
    Mi sono informato un attimo ed in effetti è come dici, gli sviluppatori non sono partiti da alcuna strategia standard e non hanno "allenato" Libratus su di un database di mani giocate (ha imparato giocando da solo). Poi da quanto ho capito ci sono tutta una serie di aggiustamenti che è in grado di fare in game e post sessione credo in un'ottica exploitativa.
    Dalle interviste ai giocatori traspare che si sentono piuttosto battuti, e questo sembra essere dunque un risultato significativo.
    Restano tuttavia alcuni aspetti che secondo me possono influenzare la stima dell'atteso di Libratus vs umani:

    - perdere un centesimo o infinito è uguale in termini di vincite, trovandosi sotto i giocatori sono portati ad aumentare il profilo di rischio, quindi giocate potenzialmente non ottimali etc che abbassano l'atteso;
    - gli adattamenti potrebbero richiedere più di qualche giorno e più di 30K mani a testa (tra l'altro non so se hanno hand history a disposizione). Ho letto che stanno sperimentando strategie come open da bottone 6X...insomma, sembrano lavori in corso.
    - varianza. Le mani sono poche e anche accorgimenti come scambiare le carte non so quanto possano influire.

    Purtroppo per adesso questi test sono piuttosto costosi sia in termini di tempo che a livello economico. Sarebbe interessante vedere dei rematch dopo uno studio da parte degli umani delle mani giocate, e altri test di Libratus vs bot sviluppati secondo principi differenti.
    Fa aggiustamenti, ma non è chiaro se siano "exploit" della strategia di oppo, o semplicemente l'algoritmo si updata usando i dati delle mani che ha giocato per modificare le sue funzioni di valore in generale. Cioè non è chiaro se "migliora" exploitando o semplicemente perchè usa le sessioni per convergere sempre meglio vs GTO.

    Cmq è finita la sfida, i grafici sono questi



    Tenere conto che Jaon e Dongkim avevano le mani speculari quindi è abbastanza plausibile che semplicemente il "lato" di dongkim fosse running hot, e quelle le avute il bot vs jason.

    La pendenza della curva dei risultati complessivi fa pensare che 1) gli "aggiornamenti" di libratus abbiano almeno all'inizio avuto un impatto 2) l'effetto "ora tocca aggrare di + / gamblare di + per recuperare" non sia stato particolarmente rilevante anche se è visibile da grafico (peggiora la pendenza sul finale ma di poco)

    Il bot li ha proprio killati.
    ilgrandezuma and conilmionome like this.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  11. #91
    Ball Till You Fall L'avatar di zio_slim
    Registrato il
    Aug 2007
    Località
    Milano
    Reputazione
    229
    Posts
    7,717
    Citato in
    780 Post(s)

    Predefinito

    ci sono 2 lance da spezzare a favore degli umani:

    1 - impossibilità di quittare
    tutti sanno quanto sia importante quittare HU cash. Quando la sessione è storta, quando avversario runna dio, etc... ognuno ha i suoi motivi.
    Gli umani in questa sfida non potevano quittare, avevano una time schedule serratissima; hanno detto di aver giocato 11-12 ore al giorno per 2 settimane di fila, senza day off. Ora potete venirmi anche a dire che sono 4 tra i top 10 mondo in HU, ma l'uomo si stanca e sbaglia le scelte, il computer no. Va detto che sono stati loro ad accettare una schedule impostata così, quindi se la sono cercata (sottostimando evidentemente la forza di Libratus).

    2 - può aver spostato qualcosa la dinamica dei piatti in all-in divisi per equity.
    In questa sfida quelli dell'uni hanno deciso di choppare i piatti per equity in ogni situazione di all-in per ridurre la varianza, ma in realtà credo l'abbiano aumentata; esempio Dong Kim parlava di uno spot in cui è andato rotto turn in 3bettato con A9 su AJ9x vs AJ di Libratus, ha perso un botto anche se river è uscito il 9. Nella mano mirror invece Libratus ha callato fino al river e ha shovato quando ha fatto full e ha vinto pot da un miliardo.
    Ora non sapremo mai come sarebbe andata se tutta la sfida fosse stata fatta senza l'equity chop negli all-in, di sicuro però i risultati tra hand e mirror hand sono stati più varianzosi al contrario di quello che pensavano gli universitari.

    Detto questo la sconfitta è netta e anche i pro hanno ammesso di essere sorpresi dalla bravura di Libratus; dobbiamo calcolare però che ci sono fattori come questi che ho elencato che probabilmente hanno reso la batosta più pesante di quella che sarebbe stata se le partite si fossero giocate a soldi veri tra top pro e bot.
    conilmionome likes this.
    Follow me on Facebook and Twitter

  12. #92
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1597
    Posts
    17,726
    Citato in
    2822 Post(s)

    Predefinito

    Citazione Originariamente Scritto da zio_slim Visualizza Messaggio
    ci sono 2 lance da spezzare a favore degli umani:

    1 - impossibilità di quittare
    tutti sanno quanto sia importante quittare HU cash. Quando la sessione è storta, quando avversario runna dio, etc... ognuno ha i suoi motivi.
    Gli umani in questa sfida non potevano quittare, avevano una time schedule serratissima; hanno detto di aver giocato 11-12 ore al giorno per 2 settimane di fila, senza day off. Ora potete venirmi anche a dire che sono 4 tra i top 10 mondo in HU, ma l'uomo si stanca e sbaglia le scelte, il computer no. Va detto che sono stati loro ad accettare una schedule impostata così, quindi se la sono cercata (sottostimando evidentemente la forza di Libratus).

    2 - può aver spostato qualcosa la dinamica dei piatti in all-in divisi per equity.
    In questa sfida quelli dell'uni hanno deciso di choppare i piatti per equity in ogni situazione di all-in per ridurre la varianza, ma in realtà credo l'abbiano aumentata; esempio Dong Kim parlava di uno spot in cui è andato rotto turn in 3bettato con A9 su AJ9x vs AJ di Libratus, ha perso un botto anche se river è uscito il 9. Nella mano mirror invece Libratus ha callato fino al river e ha shovato quando ha fatto full e ha vinto pot da un miliardo.
    Ora non sapremo mai come sarebbe andata se tutta la sfida fosse stata fatta senza l'equity chop negli all-in, di sicuro però i risultati tra hand e mirror hand sono stati più varianzosi al contrario di quello che pensavano gli universitari.

    Detto questo la sconfitta è netta e anche i pro hanno ammesso di essere sorpresi dalla bravura di Libratus; dobbiamo calcolare però che ci sono fattori come questi che ho elencato che probabilmente hanno reso la batosta più pesante di quella che sarebbe stata se le partite si fossero giocate a soldi veri tra top pro e bot.
    Per l'equity chop in mirror hand nel thread di 2+2 han risposto i ricercatori, ci son metodi per analizzare come varia la varianza con quello strumento , han detto che si riduce ma di poco.

    Nel senso che l'effetto mirror quasi lo perdi con equity chop (in quelle mani) ma c'è cmq (a riduzione della varianza).

    Non ho motivo di pensare che si sbaglino e non ho le competenze salvo spenderci 3 giorni sopra per capire se la dimostrazione statistica di questo è vera (c'è nel paper mi pare), tendo a fidarmi di quel che dicono sti tizi, comunque son paper peer-reviewed.

    Non sappiamo con QUESTA run di carte come sarebbe andata la sfida senza equity chop ma quello che sappiamo a lvl statistico è che la varianza, definita come il sigma nella distribuzione normale dei valori del profit/loss per ogni 100 mani, sarebbe stato + alto ceteris paribus in assenza di equity chop.
    zio_slim and conilmionome like this.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  13. #93
    Fish
    Registrato il
    Apr 2016
    Reputazione
    0
    Posts
    14
    Citato in
    0 Post(s)

    Predefinito

    Nell'esempio A9 vs AJ si potrebbe anche argomentare che la scelta di Libratus di non andare rotto turn in quel contesto fosse quella ad atteso maggiore (se non sbaglio erano 200X), anche se non voglio certo mettermi a criticare le giocate.
    Sarei curioso di leggere l'articolo dove si analizzano gli effetti sulla varianza delle mirror hands...
    Ultima modifica di 2Big2Fail; 31-01-2017 alle 23:42
    conilmionome likes this.

  14. #94
    Fish
    Registrato il
    Apr 2016
    Reputazione
    0
    Posts
    14
    Citato in
    0 Post(s)

    Predefinito

    Citazione Originariamente Scritto da Luciom Visualizza Messaggio
    Fa aggiustamenti, ma non è chiaro se siano "exploit" della strategia di oppo, o semplicemente l'algoritmo si updata usando i dati delle mani che ha giocato per modificare le sue funzioni di valore in generale. Cioè non è chiaro se "migliora" exploitando o semplicemente perchè usa le sessioni per convergere sempre meglio vs GTO.
    Che senso avrebbe convergere a GTO? Chiedo perchè non me ne intendo, ma GTO non è una strategia non-exploitabile? Se fai risolvere ad un algoritmo la morra cinese ti tira fuori una giocata causale tra sasso, forbice e carta. Il risultato di questa strategia sarebbe tuttavia un pareggio contro chiunque. Per vincere a morra cinese è necessario trovare delle frequenze non bilanciate (o cmq pattern) e diventare a propria volta non bilanciati in modo profittevole.
    Se Libratus si è allenato giocando contro se stesso avrà cercato di convergere a GTO per non perdere, tuttavia gli aggiustamenti in game o post sessione sulle mani di oppo dovrebbero essere effettuati in un'ottica exploitativa.

  15. #95
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1597
    Posts
    17,726
    Citato in
    2822 Post(s)

    Predefinito

    Citazione Originariamente Scritto da 2Big2Fail Visualizza Messaggio
    Che senso avrebbe convergere a GTO? Chiedo perchè non me ne intendo, ma GTO non è una strategia non-exploitabile? Se fai risolvere ad un algoritmo la morra cinese ti tira fuori una giocata causale tra sasso, forbice e carta. Il risultato di questa strategia sarebbe tuttavia un pareggio contro chiunque. Per vincere a morra cinese è necessario trovare delle frequenze non bilanciate (o cmq pattern) e diventare a propria volta non bilanciati in modo profittevole.
    Se Libratus si è allenato giocando contro se stesso avrà cercato di convergere a GTO per non perdere, tuttavia gli aggiustamenti in game o post sessione sulle mani di oppo dovrebbero essere effettuati in un'ottica exploitativa.
    Carta forbice sasso è un pareggio contro chiunque perchè è un gioco ultrasemplificato.

    GTO in giochi + normali è "non puoi perdere". Esempio?

    Questo gioco qui



    Qui se giochi GTO (che è la strategia che la gente con QI non infimo sviluppa abbastanza in fretta) non perdi mai e vinci in un tot di occasioni in cui oppo devia a sufficienza per farti vincere. La prova? l'ho insegnato a mio figlio di 4 anni e ancora nn riesce a giocare GTO quindi un tot di volte perde.

    La quasi totalità dei giochi 1v1 segue quel modello, non quello di morra cinese che è un caso anomalo "degenerato" dalla ultrasemplificazione.

    Questa tua obiezione è piuttosto frequente da chi non mastica bene la teoria dei giochi, l'idea che GTO sia "solo" un non perdere e non produca vittorie. Tieni conto che nella quasi totalità dei giochi agire per non perdere ti porta anche verso la vittoria.

    Se l'esempio del tris non ti è sufficiente pensa a forza 4, o a tris a 5 su foglio di carta a quadretti dove il tabellone è "infinito". Ogni volta che giochi a "non perdere" tieni conto che non stai difendendo solo la mossa successiva ma tutte le altre, e nel farlo ti stai posizionando in modi che tendono alla vittoria, anche se non "ottimo" RISPETTO a eventuali leak dell'avversario.

    La dama è risolta (i bot giocano GTO). Se giochi contro un bot di dama non è che fa robe particolarmente strane. + che altro lo vedrai sviluppare pian piano il vantaggio con poca "scioltezza" ma prima o poi tu fai una mossa oggettivamente -ev (oggettivo nel senso che a tavolino con calma puoi vedere che da quel momento hai creato una sequenza per la quale se bot fa 5 specifiche mosse tu perdi un pezzo in +), lui può capitalizzare quell'errore senza mai regalare un millimetro e gg.

    Nel gioco a informazione imperfetta può essere meno ovvio cosa significa GTO, ma in sostanza, per il poker, significa che se tu vs il GTO-Bot foldi un pò troppo, o troppo poco, qualunque porzione di range in qualunque spot perdi soldi (in media, in termini di ev). E' come se in ogni spot ci fossero un tot di scelte, molte sono equivalenti e non regalano ev all'oppo, NESSUNA tua scelta genera ev per te, tu puoi solo sbagliare o fare pari giocando contro GTO.

    Prima o poi sbagli qualcosa e quello è ev che va di là e non torna mai +. E poi ci sono gli spot dopo e si continua così finchè non hai finito tutto il roll.

    Convergere verso GTO significa questo, dato che il poker non è risolto e non abbiamo la mappa completa di cosa sia oggettivamente giusto in termini di equilibrio di nash in ogni spot con ogni combo di carte, significa aver migliorato la approssimazione con la quale tendi verso l'optimum.

    Ti faccio un esempio per capirci : su turn Kh Ts Ad 4c, con action che è andata tuo raise pre suo call, check check turn, esiste una qualche definizione del range "perfetto" che tu devi avere. Cioè esiste (ed è il GTO che il bot cerca di approssimare) un elenco esaustivo di tutte le mani che devi avere lì. Cioè su 1M di volte devi avere magari 33 volte Ac 3c per capirci. E ogni altra combo con pesi diversi. Tutte le volte che hai esattamente quel range, qualunque cosa fa oppo non perdi soldi. Tutte le altre volte puoi occasionalmente perdere soldi (in senso di EV se si rigioca lo spot all'infinito). L'umano arriva in quello spot con un range + distante da GTO del bot. Quindi quando si ripropone quello spot, l'umano in media perde + soldi del bot. E questo vale per ogni singolo spot. Turn e river di + perchè il bot è MOLTO + vicino a GTO a turn/river (dato che sono un numero di situazioni non gigantesco , partendo dal flop, è in grado di risolvere molto + esattamente che partendo dal preflop).

    E se è GTO QUALUNQUE COSA FAI TE NON CAMBIA, non nel senso che perdi uguale qualunque cosa fai però! non cambia nel senso di NON C'E' NIENTE CHE TU POSSA FARE per ottenere valore. Puoi decisamente perdere valore in varia misura a seconda di cosa fai.

    Immagina un indovinello nel quale se dai la risposta esatta non perdi niente, non puoi mai guadagnare, e a seconda del tipo di risposta sbagliata che dai perdi poco o molto. Immagina un gioco vs GTO come una serie di indovinelli di quel tipo.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  16. #96
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1597
    Posts
    17,726
    Citato in
    2822 Post(s)

    Predefinito

    A chi interessa, la dama (che come sappiamo è stata risolta) è stata risolta.... sempre da quelli dell'università dell'Alberta !!!

    Non avevo mai controllato gli autori della soluzione nè letto i dettagli

    Qui si può giocare contro il bot di dama loro, tunato leggermente per consentire occasionali chance di pareggio

    Play Chinook - World Man- Machine Checkers Champion

    Questo per dare un'idea di cos'è giocare contro GTO
    MasterChef likes this.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  17. #97
    Antonius L'avatar di francio
    Registrato il
    Nov 2009
    Località
    Barletta(BAT)
    Reputazione
    21
    Posts
    3,186
    Citato in
    411 Post(s)

    Predefinito

    dove si compra sto bot? lo metto a grindare al posto mio 24/7.
    http://blog.giallozafferano.it/chicchedigusto/
    "Lol. Change game." (cit. Visdiabuli)
    Renar80: consiglio da amico, grinda un po' meno e studia di +
    digeps: francio mi sa che tu l anno prossimo sei rotto
    harry: 2 anni fa giocavi il NL200, ora grindi il NL20, continua così campione che ci dimostri come la selezione naturale non riguarda solo gli altri.

  18. #98
    Calling Station
    Registrato il
    Jul 2013
    Reputazione
    14
    Posts
    163
    Citato in
    7 Post(s)

    Predefinito

    Luciom ha reso benissimo il concetto di GTO per i giochi con 2 giocatori, voglio solo aggiungere che il discorso è completamente diverso nel gioco con 3 o più giocatori che infatti è un campo ancora poco esplorato. Intanto non c'è una dimostrazione che l'algoritmo su cui si basano tutti questi bot, il cfr, converga a un equilibrio di Nash con più di 2 giocatori. Anche se empiricamente sembra farlo e quindi si pensa di sì. Ma questo è il meno, infatti il grosso problema è che con più giocatori giocare una strategia che appartiene a un equilibrio non è più garanzia di non perdita tanto meno di vittoria. Infatti se per esempio pensiamo a un poker con bot GTO e due avversari non GTO, uno di questi potrebbe usare una strategia perdente tale da danneggiare anche noi e far si che il grosso finisca nelle tasche del terzo. In parole povere potrebbero costruire una sorta di alleanza involontaria data dal fatto che uno gioca male e l'altro sa sfruttare la situazione meglio di tutti.

    Però ogni volta che uno folda in un gioco a 3 e si rimane in due nella mano diventa un sub-game dove valgono tutte le considerazioni per la GTO con 2 giocatori. La soluzione però deve partire dai range attuali che non coincidono con quelli che un equilibrio di Nash per 3 giocatori potrebbe attribuire all'avversario.
    Ultima modifica di MasterChef; 01-02-2017 alle 11:55
    Whinaments likes this.

  19. #99
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1597
    Posts
    17,726
    Citato in
    2822 Post(s)

    Predefinito

    Citazione Originariamente Scritto da MasterChef Visualizza Messaggio
    Luciom ha reso benissimo il concetto di GTO per i giochi con 2 giocatori, voglio solo aggiungere che il discorso è completamente diverso nel gioco con 3 o più giocatori che infatti è un campo ancora poco esplorato. Intanto non c'è una dimostrazione che l'algoritmo su cui si basano tutti questi bot, il cfr, converga a un equilibrio di Nash con più di 2 giocatori. Anche se empiricamente sembra farlo e quindi si pensa di sì. Ma questo è il meno, infatti il grosso problema è che con più giocatori giocare una strategia che appartiene a un equilibrio non è più garanzia di non perdita tanto meno di vittoria. Infatti se per esempio pensiamo a un poker con bot GTO e due avversari non GTO, uno di questi potrebbe usare una strategia perdente tale da danneggiare anche noi e far si che il grosso finisca nelle tasche del terzo. In parole povere potrebbero costruire una sorta di alleanza involontaria data dal fatto che uno gioca male e l'altro sa sfruttare la situazione meglio di tutti.

    Però ogni volta che uno folda in un gioco a 3 e si rimane in due nella mano diventa un sub-game dove valgono tutte le considerazioni per la GTO con 2 giocatori. La soluzione però deve partire dai range attuali che non coincidono con quelli che un equilibrio di Nash per 3 giocatori potrebbe attribuire all'avversario.
    Per 3+ giocatori non si può parlare proprio di equilibrio di nash (anzi a essere precisi, non è detto che se ne possa parlare, mentre è sempre presente a 2 giocatori), per cui la definizione stessa di GTO viene meno.

    Quindi non è tanto una questione di dimostrare la convergenza a GTO, è che non sappiamo se nash si applica. Quindi il bot stesso non sarebbe GTO. Cioè è ancora + distante di come appare da come scrivi tu.

    Il che però, mi duole dirlo a chi pensa che questo significhi che fare bot forti 6max non sia fattibile, non inficia di molto la possibilità di un bot di killare il field. Perchè? perrchè aneddoticamente da pokeristi sappiamo che se giochi uno pseudo-gto anche raffazzonato (come possono sperare di fare gli umani) killi il field.

    Quindi sappiamo che quantomeno a poker gli effetti di implicit collusion sono limitati e sono abbastanza convinto che un bot headsup generalizzato al 6max killerebbe già oggi comunque il field (se avesse modo di partire da quel che è libratus oggi).
    conilmionome likes this.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  20. #100
    Calling Station
    Registrato il
    Jul 2013
    Reputazione
    14
    Posts
    163
    Citato in
    7 Post(s)

    Predefinito

    Citazione Originariamente Scritto da Luciom Visualizza Messaggio
    Per 3+ giocatori non si può parlare proprio di equilibrio di nash (anzi a essere precisi, non è detto che se ne possa parlare, mentre è sempre presente a 2 giocatori), per cui la definizione stessa di GTO viene meno.

    Quindi non è tanto una questione di dimostrare la convergenza a GTO, è che non sappiamo se nash si applica. Quindi il bot stesso non sarebbe GTO. Cioè è ancora + distante di come appare da come scrivi tu.

    Il che però, mi duole dirlo a chi pensa che questo significhi che fare bot forti 6max non sia fattibile, non inficia di molto la possibilità di un bot di killare il field. Perchè? perrchè aneddoticamente da pokeristi sappiamo che se giochi uno pseudo-gto anche raffazzonato (come possono sperare di fare gli umani) killi il field.

    Quindi sappiamo che quantomeno a poker gli effetti di implicit collusion sono limitati e sono abbastanza convinto che un bot headsup generalizzato al 6max killerebbe già oggi comunque il field (se avesse modo di partire da quel che è libratus oggi).
    Almeno un equilibrio di Nash esiste in qualsiasi gioco che ha un numero finito di giocatori e un numero finito di strategie pure. Il poker rispetta queste condizioni quindi un equilibrio esiste. Il problema è che acquista tutto un altro significato, forse viene meno il concetto di GTO. Cioè una strategia che fa parte di un equilibrio non è in alcun modo garantita ottimale rispetto alla configurazione corrente delle strategie degli avversari.
    Concordo anche io che un bot forte come libratus anche adattato grossolanamente killerebbe qualsiasi field, salvo correggere periodicamente qualche bug, exploit che le persone trovano. Anzi sono ancora più pessimista, considerando che in tutte le pr, esclusa stars, se ne potrebbe facilmente mettere più di uno della stessa casa al tavolo credo che potrebbe dare un valore mostruoso alla conoscenza di 2 o 4 out in più (le carte che hanno in mano).
    coldfireman likes this.

Pagina 5 di 7 PrimaPrima 1234567 UltimaUltima

Informazioni Discussione

Utenti che Stanno Visualizzando Questa Discussione

Ci sono attualmente 1 utenti che stanno visualizzando questa discussione. (0 utenti e 1 ospiti)

Segnalibri

Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •