'Project' 카테고리의 글 목록

추출 요약이라는 task를 수행하기 위하여 구글의 BERT 모델을 fine-tuning 하기 위해 다음과 같은 연구를 수행하였습니다. BERT vs GPT -> 버트는 fine tunning을 하기 위해 만들어진 반면 GPT는 fine tunning이 필요 없도록 만들어짐(대신 모델크기 大) -> 선행학습된 bert를 찾아서 다운받은 뒤 우리 프로젝트의 "강의요약" 이라는 task에 맞게 fine tunning 과정을 수행 모델 Train(Fine-tuning) 간략한 흐름 1. 데이터셋 불러오기 2. 데이터 정제/정규화 3. 데이터 토큰화 (Kobert 토크나이저) 4. 데이터 패딩 및 attention_mask(패딩이 아니면 1, 패딩이면 0, 0인 부분은 어텐션 수행이 안되어 속도 향상) 5. tr..

Project/core 2022. 5. 17. 21:50

[Django + ] 딥러닝 모델 웹 배포 오류 - Spacy

보호되어 있는 글입니다.

Project/web 2022. 3. 11. 12:58

[Django] ImportError: cannot import name ‘url’ from ‘django.conf.urls’

보호되어 있는 글입니다.

Project/web 2022. 3. 9. 17:25

[Django] DB 연동, Model 설계, migration

Django에서는 DB를 사용할 때 ORM(Object-Relation Mapping) 추상화 계층을 통해 실제 Table의 Field형식에 구애받지 않고 다양한 형식의 Field를 사용할 수 있습니다. 1. Model 정의하고 Admin모듈에 등록하기 models.py에 정의한 models.Model을 상속받은 Class들은 각각 하나의 Table에 대응하며, Class에 속한 멤버 변수들은 Table을 구성하는 Field에 대응됩니다. 따라서 그냥 파이썬 Class를 정의하듯이 필요한 Table들을 models.py에 나열해 주면 되는 것입니다. https://www.tuwlab.com/ece/26465

Project/web 2022. 2. 18. 18:03

API 명세서

보호되어 있는 글입니다.

Project/web 2022. 2. 18. 17:51

백앤드 개발 시작하기

보호되어 있는 글입니다.

Project/web 2022. 2. 14. 17:57

[Berkley Constituency parser] 서술어 / 명사구 위치에서 문장 분할하기

미친 오류의 향연... 그대로 clone 해온건데 도대체 왜 빨간줄이 뜨는지 ㅎ 아마도 이거 만든 사람은 숫자가 없는 본문을 text로 쓴 것 같다. 근데 나는 21장짜리 cs231n 강의 대본을 넣었더니 그 안에 숫자가 나왔었나부당. sorted 함수에서 key = len 을 쓰면 리스트 각 요소들의 길이 순으로 정렬을 해주는데 요소들 중 자료형이 str이 아닌 것들이 있고 (예를 들면 int), 걔네의 길이를 정의할 수 없어서 오류가 난 것 같다. 리스트 각 요소들의 자료형 일괄적으로 바꿔주는 코드 삽입

Project/core 2022. 2. 11. 20:06

[알고리즘] BERT, textrank가 추출해낸 문장으로 OX 퀴즈 생성하기

1. 해당 문장을 참인 명제로 만들건지 거짓인 명제로 만들건지 -> random으로.. 1-1) if 참이 될 운명 : 바로 문제 형태로 가공 by create_quiz 함수..? 리턴값은 문제 + 답 (+영상에서 해당 문장이 등장한 위치 for 해설..? ex. 40:02 ) 1-2) else 거짓이 될 운명 : 거짓 문장으로 가공한 다음 create_quiz 함수로 보내기.. 2. 텍스트랭크 사용시 ✅ 가중치가 높은 문장 뿐 아니라 keyword(단어) 추출 가능 ✅ keyword를 리스트에 저장/ random으로 인덱스 임의로 뽑아서 / 문장 내에 있는 키워드와 리스트에서 랜덤으로 복사해온 키워드가 일치하지 않으면 swap ▶ 거짓명제 생성 * find() 로 비교 ✅ 서술어(구)에서 부정 / 긍정..

Project/core 2022. 1. 29. 19:55

버트

BERT vs GPT -> 버트는 fine tunning을 하기 위해 만들어진 반면 GPT는 fine tunning이 필요 없도록 만들어짐(대신 모델크기 大) -> 선행학습된 bert를 찾아서 다운받은 뒤 우리 프로젝트의 "강의요약" 이라는 task에 맞게 fine tunning 과정을 수행 모델 Train(Fine-tuning) 간략한 흐름 1. 데이터셋 불러오기 2. 데이터 정제/정규화 3. 데이터 토큰화 (Kobert 토크나이저) 4. 데이터 패딩 및 attention_mask(패딩이 아니면 1, 패딩이면 0, 0인 부분은 어텐션 수행이 안되어 속도 향상) 5. train, validation, test 나누기 6. train, validation, test를 torch tensor로 변환 7. T..

Project/core 2022. 1. 26. 22:52

Textrank 성능 높이기

기계학습 - clustering 보충강의 1) 1학기 textrank 추출요약 1. We have to measure this distance, with this one, with this one, with this one, with this one, with this one, with this one. 2. Right? 3. Okay, and for second step you change the cluster Center to the average of its assigned point. 4. In green, you will calculate distance with this point and you calculate in this point, right? 5. Distance from A to B..

Project/core 2022. 1. 16. 22:21

99.10.11

목록Project (12)

99.10.11

티스토리툴바