| 000 | nam c | |
| 001 | 2210080943883 | |
| 005 | 20260403113559 | |
| 007 | ta | |
| 008 | 260327s2026 bnkad m FB 000a kor | |
| 040 | ▼a221008 | |
| 041 | ▼akor▼beng | |
| 056 | ▼a004▼25 | |
| 245 | 00 | ▼aSmall eureka :▼b소형 언어 모델을 활용한 인간 수준의 강화학습 보상 설계 자동화 프레임워크 /▼d정현교 |
| 260 | ▼a부산 :▼b동아대학교 대학원,▼c2026 | |
| 300 | ▼avi, 49 p. :▼b삽화(일부천연색), 도표 ;▼c26 cm | |
| 500 | ▼z지도교수: 신승태 | |
| 500 | ▼a부록 수록 | |
| 500 | ▼a'저자요청에 의한 원문비공개(2028.01.01 이후 공개)' | |
| 500 | ▼jSmall eureka | |
| 502 | ▼a학위논문(석사)--▼b동아대학교 대학원 :▼c기계공학과,▼d2026.2 | |
| 504 | ▼a참고문헌: p. 31-36 | |
| 653 | ▼a강화학습 (Reinforcement Learning, RL)▼a보상 함수 (Reward Function)▼a보상 함수 설계 (Reward Function Design)▼a소형 언어 모델 (Small Language Model, SLM)▼a대형 언어 모델 (Large Language Model, LLM)▼aIsaac Sim▼aPPO (Proximal Policy Optimization)▼a코드 생성 (Code Generation) | |
| 700 | 1 | ▼a정현교 |
| 856 | ▼adcoll.donga.ac.kr▼uhttp://donga.dcollection.net/common/orgView/200000951256 | |
| 950 | 0 | ▼a비매품▼b\0 |
| 등록번호 | 청구기호 | 별치기호 | 소장위치 | 대출상태 | 반납예정일 | 서비스 |
|---|---|---|---|---|---|---|
|
등록번호
E1095792
|
청구기호
004 정94S
|
별치기호
D
|
소장위치
부민학위논문실
|
대출상태
대출불가 (소장처별 대출 불가)
|
반납예정일
|
서비스
|