반응형 회의록5 [20/10/24]형태소분석 오류잡기1 고딩입니다 -> stt문제 건데요, 거에요 -> 삭제 궁금 + 하다 -> 소원이가 해결가능 이제이 -> 이제 이 몇 명 을 해결 하기 위해 -> '분' 을 빼니 '여러'만 나옴 '세' 를 '셋'으로 => 1. 이다, 하다 빼버리기 2. 거에요, 건데요, 거 아예 없애기 3. 세 -> 셋 4. NB 빼지말기 ==================================== 영상 내일까지 정해서 조지기 1. STT잘 되는 것 2. 형태소 분석 잘 되는것 3. 국어사전에 최대한 많이 있는 것 2020. 10. 24. [20/10/08]우당탕탕 멘토링 + 뒷풀이 성능 측면에서 기존의 Hannanum 보다 Mecab 과 Twitter 가 좋긴하다. 하지만 Mecab은 윈도우를 지원안해주고, Twitter 는 로딩시간이 한나눔보다 길기(두배 이상)다는 단점이있다. Mecab을 간접적으로? 윈도우에서 실행할 수 있는 방법을 찾아보고 정 힘들면 한나눔으로 진행할것임 1. 통합 먼저 하고 나서 성능향상을 하자 2. 멘토님은 각각 독립적인 모듈로 만들어서 프로젝트를 진행하라고 했지만 재홍&경환 소원 STT+형태소분석 => 리스트 영상주소 스크래핑 영상저장 영상재생 이렇게 나눠서 진행할 예정 3. 웹 스크래핑 VS 웹 크롤링 웹 스크래핑 웹 크롤링 웹 파싱 웹 사이트에서 원하는 정보를 추출하는 기술 크롤러(자동화 봇)가 무수히 많은 인터넷 상의 페이지(문서, html)를 수.. 2020. 10. 8. [20/10/04]온라인회의_15:00~16:00 재홍&경환 파이참에서 실행해 보려했음 터미널은 실행잘됨 but 파이썬 콘솔에서는 안댐 -> 패키지 차이인듯 구글에관한 오류는 안뜸 pyaudio는 깔았으나 portaudio오류뜸 파이썬버전 어떻게 해야할지.. 소원 버전 통일 하자 소원이는 버전 상관없음 재홍이는 3.9 랑 .3.7 은 오류안남 ------------------------------------- 영상크롤링 광고문제인지 모르겠지만 실행이 잘 안됨 -> 수어사전으로 가서 F12로 경로따온다음에 실행 ->스트리밍x , 다운o ->이후 open CV 를 통해서 실행가능 ->gray, 영상속도 조정 가능 ->카테고리별로 날짜, 숫자, 영상에대한 쓰레기값 따라서 구분자 3개를다 알아야 동영상실행가능 경현(3.8.3 64bit) 좀더 세분화함 (8명 .. 2020. 10. 4. [200928]외대정스 형태소 분석 (Hannanum) by 카이스트 영어 -> 'F' 면 stt바로 출력(수화영상x), 추가적인 설명자막 (ex. 영어단어는 자막을 참고하세요.) 하 -> 'X' ?? " 금은 은보다 비쌉니다. " 1. 첫번째 ' 은 ' - ' J ' , 두번째 ' 은 '- ' N ' 으로 나오니 조사처리 수월해짐 2. 비쌉니다 => '비싸' - 'P' 인 것처럼 'P' 이면 +'다' 를 붙여준다. 역할 분담 : 인규 - ForPT , 포톤 경환 - STT -> 형태소 분석(함수연결 , return 값을 parameter로) 경현 - 형태소 분석 + 최대한 예외처리 재홍 - 웹크롤링, 단어별로 고유번호 매칭 소원 - 숲 보기 참고 : 경현이가 짠 코드에선 파일로 값을 읽어올 수 있음. (ex. json , t.. 2020. 9. 28. 이전 1 2 다음 반응형