Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- gru-d
- m/m/s
- ERD
- irregularly sampled time series
- nccl 설치
- nccl 업그레이드
- queueing theory
- nccl 업데이트
- Time Series
- 불규칙적 샘플링
- 리뷰
- pre-trained llm
- Transformer
- multi gpu
- pytorch
- moirai
- ed boarding
- first pg on this rank that detected no heartbeat of its watchdog.
- GaN
- 대기행렬
- operation management
- 의료정보
- 패혈증 관련 급성 호흡곤란 증후군
- NTMs
- timellm
- 딥러닝
- 토픽모델링
- timesfm
- length of stay
- 분산 학습
Archives
- Today
- Total
목록pLSA (1)
데알못정을
pLSA(Probabilistic Latent Semantic Analysis)
1. pLSA(Probabilistic Latent Semantic Analysis) pLSA는 문서 내에 특정 용어가 등장한 확률을 기반으로 하여 구축한다. 하지만 한 문서 안에 특정 단어가 등장할 확률을 단순히 빈도에 기반해 계산한다면 문서상에 나타나지 않은 단어는 0인 확률값을 가지므로 적절하지 않다. 그래서 pLSA는 한 문서가 아닌 다른 문서들을 활용하여 확률을 추정한다. 이를 이뤄내기 위해 Latent Concept(=Topic)을 도입하여 문서와 단어의 확률을 계산한다. 이때, 토픽에 대한 사전정보 없이, 문서-단어 동시 발생행렬만을 이용한다. pLSA의 관점은 그림 1과 같다. 왼쪽의 초록색 노드들은 각 document이다. 그림에서 볼 수 있듯, 총 8개의 문서를 갖고있다고 가정하자. 우..
Topic Modeling
2022. 12. 19. 15:25