heartcored98 / Standalone-DeepLearning

2019 KAIST 딥러닝 홀로서기 세미나용 저장소입니다.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

안녕하세요! 코드에 대한 질문 드립니다!

jspark-93 opened this issue · comments

안녕하세요, 유튜브에 올려주신 수업 듣고 있는 학생입니다.

먼저 너무 쉽고 친절하게 잘 알려주셔서 처음 공부하는 학생인데도 불구하고 너무나 많은 도움이 되고 있습니다.
좋은 강의 올려주셔서 감사드립니다.

다름이 아니라, 유튜브에 올리신 #21.Lec을 보다가 질문이 몇개 있어서 질문드립니다!

  1. dimension_check를 하실 때, 최종적으로 [2, 512, 1, 1]이 나와서 이것을 view를 이용하여 [2,512]로 바꾼 다음 최종 layer를 통과하면 [2, 10]이 된다고 하셨는데, 마지막을 10으로 만드는 것은 이해가 되는데 batch size로 표기되어있는 2는 마지막까지 왜 1로 사라지지 않고 남아 있는지가 궁금합니다. 그게 어떤 의미를 가지는 지를 잘 모르겠습니다.. (데이터를 다쓰고 나면 1이 되어야 할 것 같은데 ,,,)

  2. 최종 predicted한 10개의 y중 가장 높은 값을 가지는 index를 추출하고 label과의 비교를 통해 맞는지를 확인하셨는데, 기존 강의에서는 최종 predicted한 값에서 softmax를 취한 뒤에 가장 높은 index를 추출한다고 하셨던 것 같아서 질문 드립니다.
    이 코드에서는 softmax가 빠진 것인가요?

  3. 추가질문 : 적다보니 궁금증이 생겼는데, softmax를 하던지 안하던지 결국 max 값이 우리가 predict한 label이 될 것 같은데, softmax를 쓰는 이유에 대해서 알려주실 수 있을까요? ㅠ

  4. 마찬가지로 질문을 드리다보니 추가적인 생긴 질문인데요 ,, 1번 질문에서 dimension_check를 할 때는 최종 [2 , 10] 이 되었는데, 코드를 다 짜고 마지막 돌려서 확인할 때는 또 [1, 10]이 된 것 같습니다(제가 제대로 확인한지는 모르겠습니다.. print로 확인해보니 [1,10] 인 것 같습니다.) 혹시 ... dimension이 최종적으로 [2, 10]이 되는 것이 맞는 것인가요 ? 아니면 [1 , 10]이 맞는 것인가요?

강의도 다 끝나고 바쁘실텐데 질문드려서 죄송합니다..
주변에 러닝하는 사람이 없어서 여쭤볼 것이 없어서 여기 남겨봅니다 ㅠ..

감사합니다!!