일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 리액트
- 졸업프로젝트
- AR
- TIL
- 딥러닝의정석
- javascript
- 프로그래머스
- 프로젝트 회고
- 카카오 블라인드 채용
- 딥러닝
- Watson Speech to Text
- 리액트를 다루는 기술
- nlp
- 유니티 음성인식
- redux
- 생활코딩
- 백준
- JSX
- Unity
- speech to text
- react
- Watson IBM
- git lfs
- upper_bound
- 코딩테스트
- NLU
- 해커톤 후기
- lower_bound
- 합성곱 신경망
- 유니티 stt
- Today
- Total
목록학교 공부 (7)
ISFP의 느리게 굴러가는 개발 블로그

유니티에서 IBM Watson Speech to Text API 사용해서 음성 인식 기능 구현하기 우리 졸업 프로젝트에서 가장 구현할 수 있을까? 와 구현했으면 좋겠던 부분이 바로 물체 인식과 음성 인식이었다. 우리가 프로젝트에서 타제품들과 차별점을 둔 것이 바로 강아지와 사용자와의 인터랙션이었기 때문이다. 원래 내가 맡은 부분은 손을 내밀었을 때 강아지가 앉게끔 하는 것이었는데, 생각보다 손 인식이 힘들어서 이걸 음성 인식으로 하면 어떨까? 하는 생각에 음성 인식을 구현하는 방법을 찾아봤다. 검색을 했을 때 다양한 API들이 나왔는데 돈을 지불해야 하는 경우도 있었고, 한국어 지원이 안되는 경우도 많았다. 그러다가 딱 맞는 것이 바로 이 IBM Watson STT API 였다. IBM Watson Sp..

랩실 세미나를 진행할 때 각자 한 강씩 발표를 맡았었는데 가장 중요한 합성곱 신경망 발표를 내가 맡았다(...) 발표할 때 기억나던 것은 사시나무처럼 떨던 나의 모습이었고 .. 그래서 만족스러웠던 발표는 아니었다. 하지만 발표를 해야돼서 가장 열심히 공부했던 장이었다. 5.1 인간 시각에서의 뉴런 인간의 눈 에서 빛 정보 포착 ↓ 빛 정보를 뇌의 시각 피질로 전달 ↓ 분석 => 이와 같은 효과적인 딥러닝 모델 구축 필요 5.2 특징 선택의 단점 ■비올라-존스 강도 감지기 -밝고 어두운 부분의 패턴이 있다는 것을 깨달음 -91.4%라는 높은 검출률 달성 but 얼굴이 그늘로 덮이면 강도 비교가 더 이상 작동X -> 근본적으로 ‘보는‘ 의미를 달성하지 못함 5.3 크기 조정 없는 기본 심층 신경망 ■컴퓨터 ..

현재 졸업프로젝트에서 AR을 사용하여 사람들이 강아지를 입양하기 전에 강아지들의 행동에 대해 미리 파악한 다음에 입양을 할 수 있도록 하게끔 입양 시뮬레이션 어플을 개발하고 있다. 학교에서 AR/VR을 다뤄본적도 없고, Unity도 처음 다루는 툴이라 약간 부딛쳐가면서 개발을 진행중이다. 이 어플리케이션이 왜 필요하다고 생각되었냐면, 사람들이 강아지들을 파양하는 이유가 '이렇게 많이 짖는 줄 몰라서', '배변 교육이 되지 않아서' 등등의 강아지의 행동에 대해 제대로 파악하지도 않고 입양을 했기 때문이다. 따라서 우리 어플리케이션에서는 미리 강아지의 행동양식에 대해 사용자가 알고, 그 행동에 맞춰 사용자가 어떤식으로 해야할지 알려줌으로써 1) 파양률 감소 2) 강아지 교육에 도움이 됨을 기대점으로 보고 있..

한 것도 별로 없는데 갑자기 콘솔에 에러가 떠서 봤더니 Request error (error): UnityEditor.AsyncHTTPClient:Done(State, Int32) 라는 에러가 떴다. 해결 방법) [Edit]-[Preferences]-[General]-[Show Asset Store search hits 체크 해제] 를 하고 유니티를 껐다 켜면 해결이 된다. 찾아보니 에셋스토어 관련 오류같은데 아까 에셋스토어 찾아봐서 그런 것 같다!

완전 이론만 배우다가 갑작스럽게 텐서플로우를 쓰게 되며 당황했던 기억이 있다... 이 장을 공부하면서 책에 나와있는 예제들을 돌려봤는데 자꾸 에러가 떠서 엄청난 스트레스를 받았던..ㅎㅎ 3.1 텐서플로란? 텐서플로는 개발자가 딥러닝 모델을 설계하고 만들고 학습시키는 것을 더 쉽게 하도록 구글이 공개한 오픈소스 소프트웨어 라이브러리이다. 텐서플로에서 ‘텐서(Tensor)’은 딥러닝에서 데이터를 표현하는 방식이다. 즉, 행렬로 표현할 수 있는 2차원 형태의 배열을 높은 차원으로 확장한 다차원 배열이다. 이 사진에서 grayscale은 이미지를 2차원 배열로 나타내지만 RGB 이미지는 각각의 3개의 채널마다 2차원 배열로 표현하는데, 이는 tensor(3차원 배열)로 표현할 수 있다. 3.4 텐서플로 변수 만..

2.1 패스트푸드 문제 세트 메뉴를 구매할 때 단품에 대한 가격을 알고 싶을 때 1. 첫 주문에 음식 하나씩 주문하는 방식->실제 상황에서 거의 결과를 얻을 수 없음 2. 학습 데이터에서 발생하는 오차를 최소화하는 가중치를 선택하기 위해 뉴런을 학습시킴 궁극적인 목표: 오차(E)가 가능한 0에 근접하게 하는 파라미터 벡터를 선택하는 것 2.2 경사 하강법(Gradient Descent) 전체 데이터에 대해 신경망의 오차를 단계적으로 접근하면서 최저 오차를 찾아가는 것. 2.3 델타 규칙과 학습률 하이퍼파라미터: 학습 과정을 수행하기 위한 학습 알고리즘에서 사용하는 한 쌍의 파라미터 곡면이 많이 평평해질 때 최소값에 가까워졌음을 알 수 있다. 학습률(€) 선택의 문제 너무 낮으면 학습 과정이 너무 길다 너..
언젠가는 정리해야했던 여름방학 랩인턴 스터디 내용이다.. 여름방학 인턴이었지만 글을 쓰고 있는 지금은 후드티를 입은 상태..ㅎㅎ 처음에 이론으로 공부할 때는 너무 어렵고 이해도 안됐었는데 마지막 프로젝트까지 끝내고 나니까 뭐라도 공부한 기분이었다! 1장 신경망 1.3 머신러닝의 작동 원리 사람들이 사물을 인식하는 방법-> 공식X, 사례를 통한 경험O 사람의 강화과정: 감각적 입력 -> 예측 -> 확인 1.4 뉴런 뉴런이란? 사람 뇌의 기본 단위 뉴런의 구조를 이용하여 머신러닝 모델을 만드는 것이 목표 인공뉴런 n개의 입력-> 가중치 곱->합쳐짐(로짓 생성)->출력 y=f(x∙w+b) 1.5 선형 퍼셉트론 선형 퍼셉트론은 하나의 뉴런으로 표현될 수 있지만, 뉴런은 선형 퍼셉트론으로 표현할 수 없는 모델을 ..