Artwork

Inhoud geleverd door Universitetet i Agder. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door Universitetet i Agder of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.
Player FM - Podcast-app
Ga offline met de app Player FM !

Julekalender luke 3: AI for kontinuerlig læring

12:37
 
Delen
 

Manage episode 348729563 series 2497947
Inhoud geleverd door Universitetet i Agder. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door Universitetet i Agder of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.

De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.

Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605

Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html

  continue reading

148 afleveringen

Artwork
iconDelen
 
Manage episode 348729563 series 2497947
Inhoud geleverd door Universitetet i Agder. Alle podcastinhoud, inclusief afleveringen, afbeeldingen en podcastbeschrijvingen, wordt rechtstreeks geüpload en geleverd door Universitetet i Agder of hun podcastplatformpartner. Als u denkt dat iemand uw auteursrechtelijk beschermde werk zonder uw toestemming gebruikt, kunt u het hier beschreven proces https://nl.player.fm/legal volgen.

De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.

Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605

Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html

  continue reading

148 afleveringen

Alle afleveringen

×
 
Loading …

Welkom op Player FM!

Player FM scant het web op podcasts van hoge kwaliteit waarvan u nu kunt genieten. Het is de beste podcast-app en werkt op Android, iPhone en internet. Aanmelden om abonnementen op verschillende apparaten te synchroniseren.

 

Korte handleiding