[์ธ๊ณต์ง€๋Šฅ] RNN Recurrent Neural Network 2

2023. 4. 12. 14:29ใ†_Study/AI

728x90

RNN2๐Ÿ‡¸.•*¨*•¸.•*¨*•¸.•*¨*•¸.•*¨*•

ํ•ด๋‹น ์ž๋ฃŒ๋Š” ๊ฐ•์˜ ํ•™์Šต์ž๋ฃŒ์ž…๋‹ˆ๋‹ค. ๊ฐ•์˜ ์ด์™ธ์˜ ๋‚ด์šฉ์€ ๊ฒ€์ƒ‰ ๋ฐ ๋‹ค์–‘ํ•œ ์ž๋ฃŒ๋ฅผ ํ†ตํ•ด ๊ณต๋ถ€ํ•˜๋ฉฐ ์ •๋ฆฌํ•œ ๋‚ด์šฉ์˜ ํฌ์ŠคํŒ…์ž…๋‹ˆ๋‹ค.

#AI #์ธ๊ณต์ง€๋Šฅ #RNN #chatgpt #python #study #0412


 

์•…๋ณด๋ฅผ ํ•™์Šตํ•˜๋Š” LSTM ์‹ ๊ฒฝ๋ง

ABC ํ‘œ๊ธฐ๋ฅผ ์—ฐ์ฃผํ•˜๋Š” ํ”„๋กœ๊ทธ๋žจ์„ ์ œ์ž‘ํ•˜๊ธฐ. 

 

 

 

 

 

accuracy ๊ฐ€ 100% : ์ž‘์€ ๋ณ„๊ณผ ๋™์ผํ•œ ๊ณณ์ด ๋˜์—ˆ์œผ๋‹ˆ, ํŽธ๊ณก์˜ ์˜๋ฏธ๊ฐ€ ์—†๋‹ค.

 

 

 

 

๋ณ€ํ˜•๋œ ์ฒซ ์†Œ์ ˆ๋กœ ํŽธ๊ณก

: ๋˜‘๊ฐ™์€ ๊ณก์„ ์ƒ์„ฑํ•ด๋‚ด๋Š” ๊ฒƒ์€ ๋ฌด์˜๋ฏธ, ์›๋ž˜ ๊ณก์˜ ํŒจํ„ด์„ ์œ ์ง€ํ•˜๋ฉด์„œ ์›๋ž˜ ๊ณก๊ณผ ๋‹ค๋ฅธ ๊ณก์„ ์ƒ์„ฑํ•˜๊ธฐ.

 

 

์„ธ ๊ณก์„ ์‹œ๊ณ„์—ด๋กœ ๋ณ€ํ™˜ํ•˜๊ณ  ๊ฒฐํ•ฉ.

 

 

 

ํ€„๋ฆฌํ‹ฐ๊ฐ€ ๋‚ฎ๊ณ  ๋†’์œผ๋ƒ๋Š” ํ•™์Šตํ•˜๊ณ  ๊ฐœ์„ ํ•˜๋ฉด ๋˜์ง€๋งŒ, ๊ตฌํ˜„ ๊ฐ€๋Šฅํ•œ๊ฒŒ ์ค‘์š”ํ•˜๋‹ค.

 

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ (Natural language processing NLP)

:์–ธ์–ด๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์ธ๊ฐ„, ์ธ๊ฐ„์ด ๊ตฌ์‚ฌํ•˜๋Š” ์–ธ์–ด๋ฅผ ์ž๋™์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๋Š” ์ธ๊ณต์ง€๋Šฅ ๋ถ„์•ผ

: ๋‹ค์–‘ํ•œ ์‘์šฉ์ด ๊ฐ€๋Šฅํ•˜๋‹ค. ์–ธ์–ด ๋ฒˆ์—ญ, ์˜ํ™”ํ‰ ๋Œ“๊ธ€ ๋ถ„์„, ๊ณ ๊ฐ ์‘๋Œ€ ์ฑ—๋ด‡, ์†Œ์„ค์ด๋‚˜ ์‹œ๋ฅผ ์“ฐ๋Š” ์ฐฝ์ž‘ ์ธ๊ณต์ง€๋Šฅ

 

 

์˜ํ™”ํ‰ ๋ฐ์ดํ„ฐ์…‹์ธ IMDF์˜ ์˜ˆ์ œ ๋ฌธ์žฅ์—์„  ํ…์ŠคํŠธ์˜ ํŠน์„ฑ์ด ์ž˜ ๋‚˜ํƒ€๋‚œ๋‹ค.

 

ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ

- ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋กœ์„œ ์‹œ๊ฐ„ ์ •๋ณด๊ฐ€ ์žˆ๊ณ  ์ƒ˜ํ”Œ๋งˆ๋‹ค ๊ธธ์ด๊ฐ€ ๋‹ค๋ฅด๋‹ค๋Š” ๊ธฐ๋ณธ ์„ฑ์งˆ

- ๊ทธ ์™ธ ๋…ํŠนํ•œ ํŠน์„ฑ

- ์‹ฌํ•œ ์žก์Œ

- ํ˜•ํƒœ์†Œ ๋ถ„์„ ํ•„์š”

- ๊ตฌ๋ฌธ๋ก ๊ณผ ์˜๋ฏธ๋ก 

- ๋‹ค์–‘ํ•œ ์–ธ์–ด ํŠน์„ฑ

- ์‹ ๊ฒฝ๋ง์— ์ž…๋ ฅํ•˜๋ ค๋ฉด ๊ธฐํ˜ธ๋ฅผ ์ˆ˜์น˜๋กœ ๋ณ€ํ™˜ํ•ด์•ผ ํ•จ

 

์›ํ•ซ ์ฝ”๋“œ ํ‘œํ˜„์œผ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์ ˆ์ฐจ

์˜ˆ) ๋ง๋ญ‰์น˜ ์‚ฌ๋ก€

๋‹จ์–ด ์ˆ˜์ง‘ (๊ด„ํ˜ธ , ๋นˆ๋„์ˆ˜)

ํŒŒ์ด์ฌ์˜ ์ž๋ฃŒ๊ตฌ์กฐ์ธ ๋”•์…”๋„ˆ๋ฆฌ๋ฅผ ์ด์šฉํ•œ ํ‘œํ˜„ (๋นˆ๋„์ˆ˜์— ๋”ฐ๋ฅธ ์ˆœ์œ„ ๋ถ€์—ฌ)

ํ…์ŠคํŠธ๋ฅผ ์ˆซ์ž ์ฝ”๋“œ๋กœ ๋ณ€ํ™˜

ใ„ด

์›ํ•ซ ์ฝ”๋“œ ํ‘œํ˜„

๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ์—„์ฒญ ๋‚ญ๋น„ ๋  ์ˆ˜ ์žˆ๊ณ , ์—ฐ๊ด€๊ด€๊ณ„๋ฅผ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•œ๋‹ค๋Š” ๋‹จ์ 

 

 

ํ…์„œํ”Œ๋กœ๊ฐ€ ์ œ๊ณตํ•˜๋Š” ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ, ์˜ํ™”๋ฅผ ํ‰๊ฐ€ํ•œ ๋Œ“๊ธ€์„ ๋ชจ์•„๋‘” IMDB ๋ฐ์ดํ„ฐ ์…‹

50000๊ฐœ์˜ ๋Œ“๊ธ€์„ ๊ธ์ • ํ‰๊ฐ€์™€ ๋ถ€์ • ํ‰๊ฐ€๋กœ ๋ ˆ์ด๋ธ”๋ง

๊ฐ์ • ๋ถ„๋ฅ˜ ๋ฌธ์ œ์— ์ฃผ๋กœ ์‚ฌ์šฉ

์–‘ํ•œ ํ† ํ”ฝ์˜ ๋‰ด์Šค๋ฅผ ๋ชจ์•„๋‘” Reuters ๋ฐ์ดํ„ฐ์„ธํŠธ

 

 

๋‹จ์–ด ์ž„๋ฒ ๋”ฉ word Embeding

๋‹จ์–ด๋ฅผ ์ €์ฐจ์› ๊ณต๊ฐ„์˜ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜‘ํ•œ๋Š” ๊ธฐ๋ฒ•

๋ณดํ†ต ์ˆ˜๋ฐฑ ์ฐจ์›์„ ์‚ฌ์šฉ

๋ฐ€์ง‘ ๋ฐฑํ„ฐ

๋‹จ์˜์˜ ์˜๋ฏธ๋ฅผ ํ‘œํ˜„

์‹ ๊ฒฝ๋ง ํ•™์Šต์„ ํ†ตํ•ด ์•Œ์•„๋ƒ„.

 

ํ”„๋กœ๊ทธ๋žจ 8-8 ํ”„๋กœ๊ทธ๋žจ 8-7 ์„ฑ๋Šฅ ๋ถ„์„

: ํ”„๋กœ๊ทธ๋žจ 8-8์€ LSTM์„ ์‚ฌ์šฉํ•ด ์‹œ๊ณ„์—ด ํŠน์„ฑ์„ ๋ฐ˜์˜ํ•˜๊ณ  ์กฐ๊ธฐ ๋ฉˆ์ถค์„ ์ ์šฉํ•ด ๋” ์œ ๋ฆฌํ•œ ์ƒํ™ฉ์ธ๋ฐ ํ”„๋กœ๊ทธ๋žจ 8-7๋ณด๋‹ค ์—ด๋“ฑํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค ์™œ???

 

-> ๋‘ ํ”„๋กœ๊ทธ๋žจ ๋ชจ๋‘ ๋‹จ์–ด์˜ ๋นˆ๋„์ˆ˜์— ๋”ฐ๋ผ ๋ถ„๋ฅ˜

-boring, terrible, bad ๋“ฑ์ด ๋งŽ์œผ๋ฉด ๋ถ€์ •, wonderful, good ๋“ฑ์ด ์ž์ฃผ ๋‚˜ํƒ€๋‚˜๋ฉด ๊ธ์ •์œผ๋กœ ๋ถ„๋ฅ˜

 

๋ฌธ์žฅ์˜ ์˜๋ฏธ๋ฅผ ํŒŒ์•…ํ•˜์ง€ ๋ชปํ•œ์ฑ„ ๋ถ„๋ฅ˜

- To me all of the movies are terrible, but this one is not.

: terrible์ด ์žˆ๋‹ค๋Š” ์ด์œ ๋กœ ๋‘ ํ”„๋กœ๊ทธ๋žจ ๋ชจ๋‘ ๋ถ€์ •์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ฒฝ์šฐ

 

๋‹จ์–ด ์ž„๋ฒ ๋”ฉ ๊ณต๊ฐ„์—์„œ ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์œผ๋กœ IMDB ์ธ์‹,

- ๋‹จ์–ด ์ž„๋ฒ ๋”ฉ ๊ธฐ์ˆ ์„ ์ด์šฉํ•˜์—ฌ IMDB์˜ ์ƒ˜ํ”Œ์„ ๊ธ์ •๊ณผ ๋ถ€์ •์œผ๋กœ ๋ถ„๋ฅ˜

 

๋‹จ์–ด๋ฅผ ๋ฒกํ„ฐ ๊ณต๊ฐ„์— ํ‘œํ˜„ํ•˜๋Š” ๋‹จ์–ด ์ž„๋ฒ ๋”ฉ ๊ธฐ์ˆ 

- ์˜ค๋ž˜ ์ „ ๋ถ€ํ„ฐ ์—ฐ๊ตฌ๋˜์–ด์˜จ ์•„์ด๋””์–ด