안녕하세요! 코드에 대한 질문 드립니다!
jspark-93 opened this issue · comments
안녕하세요, 유튜브에 올려주신 수업 듣고 있는 학생입니다.
먼저 너무 쉽고 친절하게 잘 알려주셔서 처음 공부하는 학생인데도 불구하고 너무나 많은 도움이 되고 있습니다.
좋은 강의 올려주셔서 감사드립니다.
다름이 아니라, 유튜브에 올리신 #21.Lec을 보다가 질문이 몇개 있어서 질문드립니다!
-
dimension_check를 하실 때, 최종적으로 [2, 512, 1, 1]이 나와서 이것을 view를 이용하여 [2,512]로 바꾼 다음 최종 layer를 통과하면 [2, 10]이 된다고 하셨는데, 마지막을 10으로 만드는 것은 이해가 되는데 batch size로 표기되어있는 2는 마지막까지 왜 1로 사라지지 않고 남아 있는지가 궁금합니다. 그게 어떤 의미를 가지는 지를 잘 모르겠습니다.. (데이터를 다쓰고 나면 1이 되어야 할 것 같은데 ,,,)
-
최종 predicted한 10개의 y중 가장 높은 값을 가지는 index를 추출하고 label과의 비교를 통해 맞는지를 확인하셨는데, 기존 강의에서는 최종 predicted한 값에서 softmax를 취한 뒤에 가장 높은 index를 추출한다고 하셨던 것 같아서 질문 드립니다.
이 코드에서는 softmax가 빠진 것인가요? -
추가질문 : 적다보니 궁금증이 생겼는데, softmax를 하던지 안하던지 결국 max 값이 우리가 predict한 label이 될 것 같은데, softmax를 쓰는 이유에 대해서 알려주실 수 있을까요? ㅠ
-
마찬가지로 질문을 드리다보니 추가적인 생긴 질문인데요 ,, 1번 질문에서 dimension_check를 할 때는 최종 [2 , 10] 이 되었는데, 코드를 다 짜고 마지막 돌려서 확인할 때는 또 [1, 10]이 된 것 같습니다(제가 제대로 확인한지는 모르겠습니다.. print로 확인해보니 [1,10] 인 것 같습니다.) 혹시 ... dimension이 최종적으로 [2, 10]이 되는 것이 맞는 것인가요 ? 아니면 [1 , 10]이 맞는 것인가요?
강의도 다 끝나고 바쁘실텐데 질문드려서 죄송합니다..
주변에 러닝하는 사람이 없어서 여쭤볼 것이 없어서 여기 남겨봅니다 ㅠ..
감사합니다!!