Linked Paper (Paper Semantic Search Platform)
기간: 2024.04 ~ 2024.11 (소프트웨어 마에스트로)
링크: Infra Repo, Search Server Repo, Github Project
발표 자료: 최종 발표
프로젝트 개요
- 대량 논문 데이터(약 170만 건)를 의미 기반 검색으로 쉽게 탐색할 수 있는 플랫폼 개발 (MAU 8K 달성)
- 팀장 겸 백엔드·인프라 담당으로서 아키텍처 설계, 데이터 처리 파이프라인, 비용 최적화 등 전반을 주도
주요 성과
아키텍처 설계 및 인프라 관리
- AWS 기반 인프라 설계
- 실시간 vector search 및 인덱싱을 고려한 DB solution 선택
- 매주 추가되는 논문 추출 및 임베딩을 위한 배치 파이프라인 구성
- 변경 사항이 많은 인프라를 관리하기 위해 IaC(aws cdk) 도입
- CI/CD 파이프라인 개발
- 프론트, 백엔드 빌드 및 배포 자동화
- 배포 및 빌드 상태 알림 연동
- 인프라 장애 대응 및 비용 절감
- GPU 서버 마이그레이션
- Fargate(CPU) 검색 서버에 GPU workload 증가
- ECS cluster를 유지하며, fargate → capacity provider(GPU EC2)로 마이그레이션 진행
서비스 운영
- 유저 이벤트 트래킹
- 검색 전환율 및 기능의 효용을 확인하기 위한 이벤트 정의
- 사용자 유입 확인 및 플래닝에 활용하기 위한 레포트 작성
Pintos (개인 프로젝트)
링크: Pintos Repo
프로젝트 개요
- 교육용 OS인 Pintos의 기능을 구현하며 리눅스 운영체제의 핵심 구조(프로세스·스레드, 스케줄링, 메모리 관리 등) 학습
주요 구현 사항
- Thread & Scheduling: 우선순위, BSD 스케줄러 구현
- User Programs: 사용자 프로세스 로드 및 실행, 시스템 콜(프로세스, 파일 관리) 구현
- Virtual Memory: 가상 메모리 페이징 및 swapping, Stack Growth, Memory Mapping 구현