일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- pytorch
- ed boarding
- NTMs
- nccl 업그레이드
- 패혈증 관련 급성 호흡곤란 증후군
- Transformer
- 토픽모델링
- 불규칙적 샘플링
- pre-trained llm
- 의료정보
- multi gpu
- 리뷰
- 딥러닝
- nccl 업데이트
- GaN
- length of stay
- timellm
- 대기행렬
- Time Series
- ERD
- timesfm
- m/m/s
- first pg on this rank that detected no heartbeat of its watchdog.
- moirai
- operation management
- queueing theory
- irregularly sampled time series
- gru-d
- nccl 설치
- 분산 학습
- Today
- Total
목록전체 글 (45)
데알못정을
심각한 질병이나 다수의 부상의 경우에 혈압이 매우 낮아지고 이로 인해 순환 부전(Circulaotory Failure)를 유발할 수 있다. 혈압은 organ에 영양소, 산소를 공급할 만큼 큰 수준을 유지한다.(혈관에 영향을 줄 정도로 크지는 않다.) 이러한 혈압이 낮아지게 되면, 세포들이 정상 기능을 하는데 필요한 산소의 양이 부족해진다. 이를 순환 부전(Circulaotory Failure)이라 부른다. 따라서 순환 부전이 지속된다면 organ은 정상 기능을 하지 않게 된다. 예를 들어 순환 부전으로 인해 신장이 손상되면 혈액을 정상적으로 소변으로 변환하기 어려울 것이고, 이렇게 되면 circulatory shock라 부르는 심각한 환경을 초래한다. 뇌에 전달되는 산소의 양과 피부에 전달되는 혈액의 양..
데이터 전처리를 수행하던 중에 피봇 테이블을 이용하여 label을 열 정보로 두고 그에 따른 값을 매핑할 필요가 있었다. 내가 하고 싶었던 것은 위 사진에서 보이는 데이터프레임의 label이라는 값을 column으로 변환하고, 그에 대응되는 값을 각각 매칭시키고 싶었고, subject_id, stay_id, charttime은 보존되어야 하기 때문에 multi index로 설정했다. 일단 관측치가 너무 많기 때문에 위 코드 처럼 chunk 단위로 데이터를 불러왔고 chunk 단위로 pivot 변환을 수행하였다. 그 결과는 아래와 같다. 참 난해했다. column을 보면 amount와 각 label 들이 multi index로 들어가있었고, index 자체도 multi index이기 때문에 이를 그대로 전..
이 글은 Rohit Kundu가 작성한 "Domain Adaptation in Computer Vision: Everything You Need to Know"를 읽고서, 한글 번역 및 핵심 정리(요약) + 추가 정리를 위해 작성되었습니다. 또한, BOAZ ADV project를 위한 팀 세미나를 위해 정리했기 때문에, 원래 출처의 내용 중 일부 내용이 생략되었습니다. Introduction 딥러닝 알고리즘은 classification task 부터, object detection까지 다양한 Computer Vsion 분야에서 사용되었다. 하지만 이는 두 가지 문제점이 있었는데, - 첫째, neural network를 효과적으로 학습하기 위해 label이 있는 많은 데이터를 학습해야한다.(데이터에 lab..
정말 미치겠고 미치겠다. 데이터프레임의 크기도 줄여보고 구글링해서 하라는거 다 해봤는데 안되서 정말 쩔쩔 맸다. 데이터셋의 크기가 2백만개가 넘어 매우 컸기 때문에 데이터프레임의 값을 열로 변형하는 pivot trasform은 부하가 많이 컸다. 그러던 중 데이터프레임을 여러개로 분할하여 따로따로 pivot을 시도해보면 어떨까라는 생각에 나는 노가다를 하기 시작했다. 근데 이렇게 해도 메모리 에러가 발생했다. 진짜 죽고싶었다. 그러던 중 read_csv에 chunksize라는 인자가 있다는 것을 알게되었다. 데이터프레임에서 원하는 컬럼만 불러올 수 있듯이, 데이터셋의 샘플을 특정 몇개로 쪼개서(chunk) 불러와 모아두는 하나의 생성자(generator)를 만들 수 있다. 코드는 다음과 같다. impor..
최근 연구실을 옮기면서 새로운 환경에서 작업을 하게되었는데, 딥러닝 학습 환경을 만들기 위해 새로운 가상환경을 만들어야 했다. 절차가 그리 까다롭지 않아서 외우고 있었는데 사람인지라 까먹게되서 그냥 여기다 정리하고 필요할 때 마다 보려고 정리한다. 가상환경 관련 명령어는 다음과 같다. 아나콘다 명령 프롬프트를 열어 사용할 수 있다. # 가상환경 목록 확인 conda info --envs # 가상환경 삭제 conda remove -n 가상환경이름 --all # 가상환경 복사 conda create -n 새로운 가상환경 이름 --clone 복제 할 가상환경 # 가상환경 활성화 conda activate 가상환경 이름 # 가상환경 내의 패키지 확인 conda list # 가상환경 내에 패키지 설치 conda ..
1. What is Multimodal Learning? 멀티모달 러닝이란 인간의 "5가지 감각기관"과 같이 multiple modalities로부터 다양한 정보를 처리하고 연결시키는 모델을 만들어서, 인간의 인지적 학습방법과 같이 세계를 이해하는 학습 방법이다. 인간의 5가지 감각기관이라 하면 시각, 후각, 미각, 촉각, 청각 등이 있겠지만 머신러닝에 실제로 구현하고자 하는 모달은 시각(사진, 동영상, 글), 청각(음성)에 해당할 수 있다. 즉 multimodal learning에서 다루고자 하는 modal은 아래와 같다. Verbal(written or spoken, words, syntax,....) Vocal(sounds, para-verbal, prosody, vocal expressions,...