전체 글(19)
-
[linux] tmux 단축키 안 먹음
tmux 단축키(cntrl + b + 명령키)가 안 되어서 일단 임시 방편으로 단축키 없이 한다. 원래는 https://sarah950716.tistory.com/21 이것대로 잘만 됐었는데 안 된다. - 새로운 session 생성 tmux new -s [session 이름] - 세션 목록 확인 tmux ls - detach session tmux detach - attach session tmux attach -t [session 이름] - 새로운 window 생성 tmux new-window - window 이동 tmux select-window [window 번호] - window 없애기 tmux kill-window - pane 분할 tmux split-window [-h: 세로로 분할, -v: ..
2021.12.23 -
[ElasticSearch] ElasticSearch DSL 더보기
1. Two Types of Clauses 두 가지 종류의 절(clauses)를 사용하여 query를 구성한다. leaf query clauses : 특정 필드에 특정 값이 있는지 확인하는 절 (예: match, term, range 등) compound query clauses: leaf query나 compound query를 감싸서 여러 쿼리를 논리적으로 연결하는 절(예: bool, dis_max) 2. Query and Filter Context Elasticsearch의 검색 결과는 relevance scores에 따라 정렬된다. search API 응답 결과의 _score이 relevance를 의미한다. Elasticsearch 기본적으로 BM25(관련 링크)를 사용하여 relevance를 계..
2021.12.22 -
[ElasticSearch] ElasticSearch 개요
1. Elasticsearch 기본 개념(출처 링크) 한마디로 역색인(inverted index)방식으로 데이터 저장해서, 쿼리값을 포함하는 문서를 찾을 수 있게 하는 검색엔진 (1) Elasticsearch의 데이터 저장 방식 Elasticsearch는 [특정 value, 그 value를 포함하는 document] 형식으로 데이터를 저장한다. RDBMS처럼 한 행 당 문서 하나를 저장하는게 아니라, 문서가 가진 값을 기준으로 한 행씩 저장하기 때문에 inverted index방식이라고 부른다. 역색인은 검색엔진에서 기본적으로 사용하는 데이터 저장 방식이다. 값을 기준으로 그 값을 포함하는 문서를 바로 저장했기 때문에 검색이 유리하다. 'database'라는 단어가 나오는 문서를 검색한다고 하자. Ela..
2021.12.22 -
[git] submodule
1. submodule이란? - git repo 아래 다른 repo를 두는 것. 2. submodule 추가하기 git submodule add [path] 3. submodule이 포함된 repo를 clone하기 git clone --recursive [path] - 그냥 clone한 다음에 아래 명령어 하는 것과 동일함. (모든 서브 모듈 업데이트) git submodule update --init --recursive (예: git submodule update --init --recursive ./child_repo 와 같이 특정 레포 지정해서 업데이트 할 수도 있음) - submodule은 하위에 포함하는 repo의 특정 커밋을 참조하는데, 그 커밋으로 업데이트 됨. # 업데이트 방식은 --..
2021.12.22 -
FantasyCoref:Coreference Resolution on Fantasy Literature Through Omniscient Writer’s Point of View
‘FantasyCoref(2021 CRAC, EMNLP)’ 프로젝트란? 보통 Coreference Resolution의 데이터셋, 가이드라인 등은 non-fiction 위주이다. 그런데 소설, 특히 비현실적인 이벤트들이 일어나는 판타지 소설에서는 기존 coreference resolution guideline으로 해결하기 어려운 문제들이 발생한다. 백설 공주를 예로 들어보자. 왕비가 마녀 분장을 하고 백설공주가 있는 난쟁이 집의 문을 두드린다. 백설공주는 문을 두드린 사람이 왕비인지 모르지만, 독자는 알고있다. 이 경우 마녀와 왕비를 하나의 엔티티로 연결해야할까? FantasyCoref 페이퍼에서는 판타지소설(주로 그림형제동화) coreference resolution dataset을 만들고, 기존 co..
2021.12.22 -
Pop Your Filter Bubble: 반대 논조의 기사 추천을 통해 필터 버블 터뜨리기
‘Pop Your Filter Bubble’ 프로젝트란? 필터버블(Filter Bubble)은 사용자에게 맞게 필터링된 정보만이 마치 거품(버블)처럼 사용자를 가둬버리는 현상을 말한다. 관심없는 정보, 싫어하는 정보는 저절로 걸러지고 사용자가 좋아할만한 정보만이 제공되면서 알고리즘이 만들어낸 정보에만 둘러싸이는 것이다. (출처: 필터버블의 덫) 추천 알고리즘의 발달로 우리는 점점 내가 좋아하는 것, 내가 익숙한 것에 쉽게 노출된다. 이것이 새로운 경험을 저해하는 장애물이 되는 것은 아닐까? 특히 ‘관점’을 담는 뉴스 기사에 추천 알고리즘을 적용하는 경우, 사용자들은 큰 그림을 보지 못하고 자기가 보고 싶은 것만 보는 ‘확증편향’에 빠지기 쉽다. 추천시스템을 역이용하여 나와 생각이 다른 기사를 함께 추천해..
2021.12.22