Il gioco è vietato ai minori di anni 18.
Giocare troppo può causare dipendenza patologica.
Pagina 6 di 7 PrimaPrima ... 234567 UltimaUltima
Risultati da 101 a 120 di 122
Like Tree70Likes

Discussione: Poker bot battle (NLHE HU BOT vs top del mondo)

  1. #101
    Fish
    Registrato il
    Apr 2016
    Reputazione
    0
    Posts
    22
    Citato in
    0 Post(s)

    Predefinito

    Citazione Originariamente Scritto da Luciom Visualizza Messaggio
    ...
    Quindi a tuo avviso un GTO in HU potrebbe essere in qualche modo codificato come un grande insieme di frequenze, range e distribuzioni di size da intendersi come valori statici indipendenti da oppo?

    Il punto è che da quanto ho capito non sappiamo se esiste una strategia statica nel poker in grado di "dominare" tutte le altre. Anche se esistesse questa strategia "X" risulterebbe comunque inferiore ad una strategia "Y" dinamica (inizialmente uguale ad "X") in grado di effettua degli adattamenti in base ai pattern di oppo. Alla fine un giocatore forte cerca di approssimare questa tipologia di strategia proprio perchè i risultati a poker non sono "vittoria"/"sconfitta", ma valori continui di bb/100 attesi.

    Libratus che se ne faceva della review? Si era allenato giocando infinite mani e tuttavia la partita con gli umani gli ha fornito spunti per avvicinarsi ulteriormente ad una strategia statica ottimale, oppure ha fatto delle analisi per evidenziare pattern ed exploitarli? Se avessi la possibilità di giocarci per prima cosa pusherei tutto preflop e chiamerei ogni suo push preflop. In questo caso la strategia che estrae meglio è facilmente decifrabile, basta chiamare/pushare ogni mano che ha equity maggiore rispetto a random hand, più tutte quelle border che hanno odds sufficienti date da piccolo/grande buio. Libratus convergerebbe gradualmente a questa strategia o continuerebbe impassibile con le sue frequenze standard?

  2. #102
    Scandinavian LAG L'avatar di UnNiubbo
    Registrato il
    Sep 2009
    Località
    Bari
    Reputazione
    173
    Posts
    714
    Citato in
    137 Post(s)

    Predefinito

    Citazione Originariamente Scritto da 2Big2Fail Visualizza Messaggio
    Quindi a tuo avviso un GTO in HU potrebbe essere in qualche modo codificato come un grande insieme di frequenze, range e distribuzioni di size da intendersi come valori statici indipendenti da oppo?

    Il punto è che da quanto ho capito non sappiamo se esiste una strategia statica nel poker in grado di "dominare" tutte le altre. Anche se esistesse questa strategia "X" risulterebbe comunque inferiore ad una strategia "Y" dinamica (inizialmente uguale ad "X") in grado di effettua degli adattamenti in base ai pattern di oppo. Alla fine un giocatore forte cerca di approssimare questa tipologia di strategia proprio perchè i risultati a poker non sono "vittoria"/"sconfitta", ma valori continui di bb/100 attesi.
    No, ti stai sbagliando, l'ha detto MasterChef nel suo ultimo post, (almeno) un equilibrio di Nash esiste nel NLHE, vedi il teorema dell'esistenza dell'equilibro.

    E questa strategia è tale che, come è stato spiegato prima da Lucio, ti permette di fottertene completamente di quel che farà il tuo avversario, tu non potrai perdere a prescindere.
    Dimostrazione del "Se dopo 20 minuti non hai capito chi è il pollo del tavolo, vuol dire che sei tu":
    [01:18:02] Lorenzissimo: come mai se mi metto sit out si mettono sit out pure gli altri reg?


    [19:58:25] Lorenzissimo: ad avere una mano ogni tanto
    [19:58:32] Lorenzissimo: tipo un Ahi
    [19:58:36] Lorenzissimo: sarebbe buono

  3. #103
    Calling Station
    Registrato il
    Jul 2013
    Reputazione
    14
    Posts
    163
    Citato in
    7 Post(s)

    Predefinito

    Citazione Originariamente Scritto da 2Big2Fail Visualizza Messaggio
    Quindi a tuo avviso un GTO in HU potrebbe essere in qualche modo codificato come un grande insieme di frequenze, range e distribuzioni di size da intendersi come valori statici indipendenti da oppo?

    Il punto è che da quanto ho capito non sappiamo se esiste una strategia statica nel poker in grado di "dominare" tutte le altre. Anche se esistesse questa strategia "X" risulterebbe comunque inferiore ad una strategia "Y" dinamica (inizialmente uguale ad "X") in grado di effettua degli adattamenti in base ai pattern di oppo. Alla fine un giocatore forte cerca di approssimare questa tipologia di strategia proprio perchè i risultati a poker non sono "vittoria"/"sconfitta", ma valori continui di bb/100 attesi.

    Libratus che se ne faceva della review? Si era allenato giocando infinite mani e tuttavia la partita con gli umani gli ha fornito spunti per avvicinarsi ulteriormente ad una strategia statica ottimale, oppure ha fatto delle analisi per evidenziare pattern ed exploitarli? Se avessi la possibilità di giocarci per prima cosa pusherei tutto preflop e chiamerei ogni suo push preflop. In questo caso la strategia che estrae meglio è facilmente decifrabile, basta chiamare/pushare ogni mano che ha equity maggiore rispetto a random hand, più tutte quelle border che hanno odds sufficienti date da piccolo/grande buio. Libratus convergerebbe gradualmente a questa strategia o continuerebbe impassibile con le sue frequenze standard?
    Sparo un briciolo di nozioni di game theory for dummies così magari capisci meglio il concetto.

    Strategia pura: una lista che prevede una scelta precisa ogni volta che abbiamo l'action (per esempio se l'avversario betta noi abbiamo 3 strategie per quel nodo di scelta, fold, call e raise, una strategia pura per il gioco completo deve specificare una scelta per ogni possibile scenario in cui ci potremmo trovare all'interno del gioco).

    Strategia mista: una distribuzione di probabilità fra strategie pure (per esempio 20% fold, 80% call con la stessa mano nella stessa situazione è una strategia mista che attribuisce una probabilità non nulla a 2 strategie pure).

    Strategia dominante: una strategia che qualsiasi cosa scelga l'avversario detiene il miglior risultato di qualsiasi altra strategia. Questo tipo di strategia esiste solo nei giochi no-brain, per esempio anche nel sasso-carta-forbici non esiste una strategia dominante.

    Best response: è quella che detiene il miglior risultato date le strategie degli avversari (es. se a sasso-carta-forbici l'avversario gioca sempre forbici la best response è giocare sempre sasso, se l'avversario gioca nash, cioè un terzo, un terzo, un terzo, qualsiasi strategia è la best-response).

    Equilibrio di Nash: è un insieme di strategie, una per ogni giocatore, che sono tutte best response. In un gioco simmetrico, come l'HU ripetuto almeno su 2 mani, esiste un equilibrio simmetrico cioè una strategia che è best-response di se stessa, chiamiamola GTO. Questa strategia contro se stessa tiene un ev pari a 0. Cioè pareggia contro la sua best-response, ergo qualsiasi altra strategia può al massimo pareggiare (nella pratica perde).

    Come dici te la GTO praticamente non è mai la best response della strategia corrente dell'avversario, cioè se oppo devia e te tieni 5bb/100 giocando GTO sicuramente esiste un'altra strategia che ti farebbe tenere 10bb/100 (numeri a caso). Però questa strategia è a sua volta exploatabile e potrebbere perdere 20bb/100 se l'avversario se ne accorge... Insomma va da se che se io avessi la GTO giocherei sempre quella che mi da la certezza di mandare rotti tutti long-term, al max devierei vs avversario super-fishy dove gli aggiustamenti sono no-brain e non devi temere exploit.

  4. #104
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1604
    Posts
    17,955
    Citato in
    2860 Post(s)

    Predefinito

    Citazione Originariamente Scritto da UnNiubbo Visualizza Messaggio
    No, ti stai sbagliando, l'ha detto MasterChef nel suo ultimo post, (almeno) un equilibrio di Nash esiste nel NLHE, vedi il teorema dell'esistenza dell'equilibro.

    E questa strategia è tale che, come è stato spiegato prima da Lucio, ti permette di fottertene completamente di quel che farà il tuo avversario, tu non potrai perdere a prescindere.
    Io mi son andato a rivedere il teorema sull'esistenza dell'equilibrio e sì, esiste almeno un equilibrio, ma in quell'equilibrio 3+ppl mica per forza fai positivo tu specifico player.

    Cioè il gioco ottimale nello specifico equilibrio che si raggiunge può essere -ev per un particolare partecipante.

    Quindi non esiste un equilibrio per ogni giocatore NEL SENSO in cui intendavamo HU cioè che ti garantisca che qualunque cosa fanno gli altri non puoi perdere.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  5. #105
    Fish
    Registrato il
    Apr 2016
    Reputazione
    0
    Posts
    22
    Citato in
    0 Post(s)

    Predefinito

    Citazione Originariamente Scritto da MasterChef Visualizza Messaggio
    Insomma va da se che se io avessi la GTO giocherei sempre quella che mi da la certezza di mandare rotti tutti long-term, al max devierei vs avversario super-fishy dove gli aggiustamenti sono no-brain e non devi temere exploit.

    Considera che questa ipotetica GTO non sappiamo quanto abbia di atteso contro altre strategie. Ad esempio la rake, sopratutto a micro-mid stakes potrebbe spostare molto rendendo la GTO perdente in alcune casistiche e/o stravolgendone le caratteristiche (d'altronde un semplice call in odds senza rake può essere fuori odds considerando la rake).
    Ripeto a mio avviso una strategia ottimale deve partire GTO e poi effettuare adattamenti nel miglior modo possibile considerando i pattern di oppo.

  6. #106
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1604
    Posts
    17,955
    Citato in
    2860 Post(s)

    Predefinito

    Citazione Originariamente Scritto da 2Big2Fail Visualizza Messaggio
    Considera che questa ipotetica GTO non sappiamo quanto abbia di atteso contro altre strategie. Ad esempio la rake, sopratutto a micro-mid stakes potrebbe spostare molto rendendo la GTO perdente in alcune casistiche e/o stravolgendone le caratteristiche (d'altronde un semplice call in odds senza rake può essere fuori odds considerando la rake).
    Ripeto a mio avviso una strategia ottimale deve partire GTO e poi effettuare adattamenti nel miglior modo possibile considerando i pattern di oppo.
    2big, cerca di capire che se fino a ieri non avevi nemmeno chiaro cosa fosse GTO, è implausibile che la tua intuizione ti porti a concetti corretti.

    Considera anche che l'aspetto exploitative è ridicolo pesarlo su euristiche basate su campioni molto piccoli. Ti servono molte + mani di quel che pensi per determinare che leak ha oppo e exploitarlo, se reg. Devi vedere veramente tanti showdown, dato che la strategia è mista e che la singola mano di per sè quasi sempre può aver senso, è una questione di quanto spesso fai una determinata cosa non di altro.

    E quasi sempre NON SAI con che mano sta facendo quella determinata cosa.

    Quindi anche se il bot vede frequenze incompatibili con GTO in certe street, non sapendo con che range viene adottata quella strategia exploitable è implausibile che possa determinare una strategia per exploitarla in modo da rendere meglio del GTO che invece (con qualche approssimazione) conosce piuttosto bene.

    Quello dell'exploitability (fish orrendi esclusi) è un mito che l'umano si racconta per pensare di avere qualcosa di molto preferibile alle macchine quando invece spesso non è altro che una copertura della mancanza di strategia pseudo-gto.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  7. #107
    Fish
    Registrato il
    Apr 2016
    Reputazione
    0
    Posts
    22
    Citato in
    0 Post(s)

    Predefinito

    Ho avuto modo di contattare Noam, uno dei due ricercatori che ha seguito il progetto. Sostanzialmente mi ha detto che gli adattamenti overnight di Libratus sono stati effettuati in un'ottica di avvicinarsi al GTO, non di exploiting degli avversari.
    Quindi, aggiungo io, probabilmente le strategie utilizzate dagli umani in qualche modo avevano degli elementi di novità rispetto a quanto visto nella fase di training. E' stato necessario fare questa "esperienza" per gestire in ottica GTO anche le linee adottate dagli umani.

  8. #108
    Scandinavian LAG L'avatar di UnNiubbo
    Registrato il
    Sep 2009
    Località
    Bari
    Reputazione
    173
    Posts
    714
    Citato in
    137 Post(s)

    Predefinito

    Citazione Originariamente Scritto da Luciom Visualizza Messaggio
    Io mi son andato a rivedere il teorema sull'esistenza dell'equilibrio e sì, esiste almeno un equilibrio, ma in quell'equilibrio 3+ppl mica per forza fai positivo tu specifico player.

    Cioè il gioco ottimale nello specifico equilibrio che si raggiunge può essere -ev per un particolare partecipante.

    Quindi non esiste un equilibrio per ogni giocatore NEL SENSO in cui intendavamo HU cioè che ti garantisca che qualunque cosa fanno gli altri non puoi perdere.
    Si, stavo parlando di HU senza specificarlo, visto che nel post di 2Big che ho quotato lui parlava di "me vs oppo", situazione HU.

    Nel 3+ la cosa si complica orrendamente, a causa del kingmaking.
    Dimostrazione del "Se dopo 20 minuti non hai capito chi è il pollo del tavolo, vuol dire che sei tu":
    [01:18:02] Lorenzissimo: come mai se mi metto sit out si mettono sit out pure gli altri reg?


    [19:58:25] Lorenzissimo: ad avere una mano ogni tanto
    [19:58:32] Lorenzissimo: tipo un Ahi
    [19:58:36] Lorenzissimo: sarebbe buono

  9. #109
    Fish
    Registrato il
    Mar 2011
    Reputazione
    1
    Posts
    38
    Citato in
    3 Post(s)

    Predefinito

    Citazione Originariamente Scritto da MasterChef Visualizza Messaggio
    Sparo un briciolo di nozioni di game theory...
    Qualche libro valido da consigliare sull'argomento? Se anche in italiano meglio...

  10. #110
    Calling Station
    Registrato il
    Jul 2013
    Reputazione
    14
    Posts
    163
    Citato in
    7 Post(s)

    Predefinito

    Citazione Originariamente Scritto da mellomello Visualizza Messaggio
    Qualche libro valido da consigliare sull'argomento? Se anche in italiano meglio...
    Purtroppo non conosco niente di divulgativo/entry-level...

    Io mi sono formato quasi interamente su libri estremamente tecnici, in particolare questo che è pure gold http://www.cs.cmu.edu/~sandholm/cs15...ame-theory.pdf e tutti i vari paper di alberta. Se cerco bene forse posso ritrovare alcune dispense di corsi italiani che fanno bene le basi ma coinvolgono qualche ragionamento che richiede la conoscenza dell'algebra lineare.

    Comunque secondo me se cerchi su amazon trovi libri per lettori di ogni livello, il tema è molto sentito e desta curiosità inoltre i concetti base e tanti toy-game, aldilà delle loro dimostrazioni sono molto logici e accessibili a chiunque.

  11. #111
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1604
    Posts
    17,955
    Citato in
    2860 Post(s)

    Predefinito

    Citazione Originariamente Scritto da mellomello Visualizza Messaggio
    Qualche libro valido da consigliare sull'argomento? Se anche in italiano meglio...
    https://www.amazon.com/Prisoners-Dil.../dp/038541580X

    Questo è bello , dilemma del prigioniero in tutte le salse non serve formazione estrema sull'argomento.

    In italiano dicono che il top sia questo (non l'ho letto)

    Teoria dei giochi. Fioravante Patrone, Decisori (razionali) interagenti

    "decisiori razionali interagenti"

    A occhio un pò formale ma per beginners, a occhio ben strutturato.

    https://www.amazon.it/Decisori-razio.../dp/8884923506

    Il sito linkato sopra è a complemento del libro non credo ci sia tutto

    ///

    In inglese nutz, corto (cioè meno di un libro, stralungo per essere articolo online), scritto in modo sublime il primer (riassunto con elencati i punti principali, le controversie, i campi di applicazione etc) sulla teoria dei giochi della SEP (stanford enciclopedia of philosophy)

    https://plato.stanford.edu/entries/game-theory/

    Questi della SEP son proprio ASSURDI per ogni tema principale del sapere, riassunti compatti di livello incredibile sullo stato dell'arte in merito, estremamemente neutrali etc etc. Avete il dubbio di cosa sia un particolare filone filosofico o simile? lì trovate tutto, come un super-wiki della filosofia e delle scienze in genere.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  12. #112
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1604
    Posts
    17,955
    Citato in
    2860 Post(s)

    Predefinito

    Poi ci sono i video di sto william spaniel su youtube, uno per ogni argomento

    https://www.youtube.com/user/JimBobJenkins

    Ne ha fatti proprio infiniti di game theory (e non solo), c'è tutto spiegato, proprio bene.

    https://www.youtube.com/playlist?lis...Xzx6U2ergFmedo

    Questo è il MOOC (corso online), 70 video di game theory
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  13. #113
    Fish
    Registrato il
    Mar 2011
    Reputazione
    1
    Posts
    38
    Citato in
    3 Post(s)

    Predefinito

    Ottimo, un buon volume di roba da leggere, grazie!!

  14. #114
    Scandinavian LAG L'avatar di diefuckersdie
    Registrato il
    Jul 2013
    Reputazione
    20
    Posts
    613
    Citato in
    212 Post(s)

    Predefinito



    Articolo sul resto del carlino di oggi, edizione Bologna.
    Soccia!

  15. #115
    Monkey Tilt L'avatar di thesegoto_11
    Registrato il
    Aug 2008
    Reputazione
    106
    Posts
    1,702
    Citato in
    242 Post(s)

    Predefinito

    Citazione Originariamente Scritto da Luciom Visualizza Messaggio
    https://www.amazon.com/Prisoners-Dil.../dp/038541580X

    Questi della SEP son proprio ASSURDI per ogni tema principale del sapere, riassunti compatti di livello incredibile sullo stato dell'arte in merito, estremamemente neutrali etc etc. Avete il dubbio di cosa sia un particolare filone filosofico o simile? lì trovate tutto, come un super-wiki della filosofia e delle scienze in genere.

    vero, sono pazzeschi! però questo sulla GT l'avevo già letto mesi fa e cita un falso storico, o che per lo meno io ricordo come tale, quando fa riferimento al fatto che cortez avrebbe bruciato le proprie navi. lo segnalo solo come curiosità, anche perché che il fatto in sé non sia storicamente certo non sposta di una virgola la validità del ragionamento.
    We build ships.

  16. #116
    Amministratore L'avatar di Luciom
    Registrato il
    Nov 2007
    Reputazione
    1604
    Posts
    17,955
    Citato in
    2860 Post(s)

    Predefinito

    Citazione Originariamente Scritto da thesegoto_11 Visualizza Messaggio
    vero, sono pazzeschi! però questo sulla GT l'avevo già letto mesi fa e cita un falso storico, o che per lo meno io ricordo come tale, quando fa riferimento al fatto che cortez avrebbe bruciato le proprie navi. lo segnalo solo come curiosità, anche perché che il fatto in sé non sia storicamente certo non sposta di una virgola la validità del ragionamento.
    PAre che le abbia distrutte e abbia esagerato con il suo equipaggio riguardo lo stato delle navi stesse ma non le abbia proprio bruciate

    https://www.jstor.org/stable/335707?...n_tab_contents

    https://www.reddit.com/r/AskHistoria...hard_would_it/
    thesegoto_11 likes this.
    Ex poker players just want to have fun moving cbet beyond poker
    Per domande e consigli: http://tinyurl.com/LuciomWell
    Twitter: luciomm1 (in prova)

  17. #117
    Banned
    Registrato il
    Apr 2015
    Reputazione
    0
    Posts
    461
    Citato in
    16 Post(s)

    Predefinito

    Pazzesco
    MasterChef likes this.

  18. #118
    Scandinavian LAG
    Registrato il
    Apr 2015
    Reputazione
    -9
    Posts
    633
    Citato in
    18 Post(s)
    conilmionome likes this.

  19. #119
    Antonius L'avatar di conilmionome
    Registrato il
    Oct 2010
    Reputazione
    60
    Posts
    2,113
    Citato in
    154 Post(s)
    Poker Nicks
    Se sei incerto o titubante tira un 5 oppure un fante

  20. #120
    Tight Agressive L'avatar di agnellina
    Registrato il
    May 2013
    Località
    Bessarabia
    Reputazione
    8
    Posts
    402
    Citato in
    68 Post(s)

    Predefinito

    Gli uomini sono tanti, anche le macchine che ci rullano!

    DeepStack, il nuovo poker bot del No-Limit Hold'em
    Picc0l0U0m0 likes this.

Pagina 6 di 7 PrimaPrima ... 234567 UltimaUltima

Informazioni Discussione

Utenti che Stanno Visualizzando Questa Discussione

Ci sono attualmente 1 utenti che stanno visualizzando questa discussione. (0 utenti e 1 ospiti)

Segnalibri

Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •