TD-Learning

aus Wikipedia, der freien Enzyklopädie