분류 전체보기
-
https://aclanthology.org/2024.emnlp-main.240/ Modular Pluralism: Pluralistic Alignment via Multi-LLM CollaborationShangbin Feng, Taylor Sorensen, Yuhan Liu, Jillian Fisher, Chan Young Park, Yejin Choi, Yulia Tsvetkov. Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing. 2024.aclanthology.org1 IntroductionBackgroundLLM alignment은 인간의 가치와 선호를 반영하도록 모델을 조정하는 것을 목표..
Modular Pluralism: Pluralistic Alignment via Multi-LLM Collaboration (EMNLP 2024)https://aclanthology.org/2024.emnlp-main.240/ Modular Pluralism: Pluralistic Alignment via Multi-LLM CollaborationShangbin Feng, Taylor Sorensen, Yuhan Liu, Jillian Fisher, Chan Young Park, Yejin Choi, Yulia Tsvetkov. Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing. 2024.aclanthology.org1 IntroductionBackgroundLLM alignment은 인간의 가치와 선호를 반영하도록 모델을 조정하는 것을 목표..
2025.11.28 -
우리는 넷플릭스의 알고리즘보다 친한 친구가 그 영화 재밌더라하고 말하는 걸 더 신뢰하곤 한다. 전통적인 협업 필터링(Collaborative Filtering)의 한계를 사회적 신뢰 네트워크(Web of Trust)로 극복하는 Network-Centric & Trust-Centric Methods에 대해 정리해보자.호모필리(Homophily)와 신뢰(Trust)신뢰 기반 추천 시스템의 전제는 유유상종, 다른 말로는 끼리끼리라는 것이다. 즉 연결된 사용자들은 비슷한 취향을 가질 확률이 높다는 것이다. 이를 추천 시스템에 적용할 때 핵심이 되는 두 가지 개념이 있다.신뢰 Trust사용자가 특정 연결된 사용자의 의견을 얼마나 신뢰하는지사용자가 친구나 연결된 사용자들의 취향과 추천을 더 신뢰하는 경향을 보임추천..
[추천 시스템] 신뢰 기반 추천 시스템우리는 넷플릭스의 알고리즘보다 친한 친구가 그 영화 재밌더라하고 말하는 걸 더 신뢰하곤 한다. 전통적인 협업 필터링(Collaborative Filtering)의 한계를 사회적 신뢰 네트워크(Web of Trust)로 극복하는 Network-Centric & Trust-Centric Methods에 대해 정리해보자.호모필리(Homophily)와 신뢰(Trust)신뢰 기반 추천 시스템의 전제는 유유상종, 다른 말로는 끼리끼리라는 것이다. 즉 연결된 사용자들은 비슷한 취향을 가질 확률이 높다는 것이다. 이를 추천 시스템에 적용할 때 핵심이 되는 두 가지 개념이 있다.신뢰 Trust사용자가 특정 연결된 사용자의 의견을 얼마나 신뢰하는지사용자가 친구나 연결된 사용자들의 취향과 추천을 더 신뢰하는 경향을 보임추천..
2025.11.28 -
현재 대부분의 AI 시스템은 한 번에 처리할 수 있는 정보의 양이 제한적이라는 한계에 부딪혀 있습니다. 이른바 '제한된 컨텍스트 윈도우' 때문인데, 이로 인해 AI는 새로운 대화를 시작할 때마다 과거의 대화 내용을 잊어버리곤 합니다. 비효율적인 '컨텍스트 체이닝(context chaining)' 방식으로는 한계가 명확했습니다. 하지만 이제 이 문제를 해결할 'Near-Infinite Memory(거의 무한한 기억력)' 기술이 주목받고 있습니다.Near-Infinite Memory란?Near-Infinite Memory AI는 AI가 과거의 상호작용을 장기간에 걸쳐 기억하고 활용할 수 있도록 하는 기술입니다. 이는 AI가 단지 새로운 데이터를 처리하는 것을 넘어, 과거 데이터를 압축·요약하여 효율적으로 기..
Near-Infinite Memory AI, ‘인생의 동반자’가 될 수 있을까?현재 대부분의 AI 시스템은 한 번에 처리할 수 있는 정보의 양이 제한적이라는 한계에 부딪혀 있습니다. 이른바 '제한된 컨텍스트 윈도우' 때문인데, 이로 인해 AI는 새로운 대화를 시작할 때마다 과거의 대화 내용을 잊어버리곤 합니다. 비효율적인 '컨텍스트 체이닝(context chaining)' 방식으로는 한계가 명확했습니다. 하지만 이제 이 문제를 해결할 'Near-Infinite Memory(거의 무한한 기억력)' 기술이 주목받고 있습니다.Near-Infinite Memory란?Near-Infinite Memory AI는 AI가 과거의 상호작용을 장기간에 걸쳐 기억하고 활용할 수 있도록 하는 기술입니다. 이는 AI가 단지 새로운 데이터를 처리하는 것을 넘어, 과거 데이터를 압축·요약하여 효율적으로 기..
2025.08.28 -
웹 서버와 웹 애플리케이션 서버는 비슷해보이지만 서로 다르다. 그 차이는 무엇일까? 웹이란? 그것에 대해 이야기하기 전 먼저 웹에 대해서 이야기하겠다. 웹이란 무엇일까? 우리는 일상 속에서 웹이라는 단어를 자주 사용하고, 보통 그것은 브라우저에서 보는 웹페이지를 의미할 것이다. 그래서 웹이란? 월드 와이드 웹(World Wide Web)의 줄임말으로 인터넷을 통해 접근하고 사용하는 정보 및 서비스의 모음을 의미하며, 1989년 팀 버너스리가 처음 만들었다. 웹은 http 프로토콜을 통해 html, image, video, sound와 같은 데이터를 주고 받으며, 전 세계의 컴퓨터 네트워크를 연결하여 정보를 공유하고 사용자들이 서로 상호작용할 수 있는 플랫폼을 제공한다. HTTP (Hypertext Tra..
[web] 웹 서버와 웹 애플리케이션 서버웹 서버와 웹 애플리케이션 서버는 비슷해보이지만 서로 다르다. 그 차이는 무엇일까? 웹이란? 그것에 대해 이야기하기 전 먼저 웹에 대해서 이야기하겠다. 웹이란 무엇일까? 우리는 일상 속에서 웹이라는 단어를 자주 사용하고, 보통 그것은 브라우저에서 보는 웹페이지를 의미할 것이다. 그래서 웹이란? 월드 와이드 웹(World Wide Web)의 줄임말으로 인터넷을 통해 접근하고 사용하는 정보 및 서비스의 모음을 의미하며, 1989년 팀 버너스리가 처음 만들었다. 웹은 http 프로토콜을 통해 html, image, video, sound와 같은 데이터를 주고 받으며, 전 세계의 컴퓨터 네트워크를 연결하여 정보를 공유하고 사용자들이 서로 상호작용할 수 있는 플랫폼을 제공한다. HTTP (Hypertext Tra..
2023.08.16 -
손실 함수를 정의하는 기준에는 뭐가 있을까? 모델이 오차를 최소화하도록 정의한다. 모델이 추정하는 관측 데이터의 확률이 최대화되도록 최대우도추정 방식으로 정의한다. 오차 최소화 예측 데이터와 target 데이터의 차이가 작아지도록 학습하는 것을 오차 최소화 관점이라고 한다. 직관적인 방법이며 어떤 방식으로 오차의 크기를 측정할지를 정하면 된다. 대표적인 오차 추정 방식에는 평균제곱오차(MSE), 평균절대오차(MAE)가 있다. 최대우도추정(Maximum Likelihood Estimator) MLE라고 부르기도 하며 먼저 우도(Likelihood)에 대해서 알아야 이해가 간다. 가능도라고 하기도 하며, 간단히 설명하자면 일어날 가능성이 얼마나 되느냐이다. 그러면 최대우도추정이란 이 가능성을 최대로 하는 방..
[DL] 손실 함수 정의 기준손실 함수를 정의하는 기준에는 뭐가 있을까? 모델이 오차를 최소화하도록 정의한다. 모델이 추정하는 관측 데이터의 확률이 최대화되도록 최대우도추정 방식으로 정의한다. 오차 최소화 예측 데이터와 target 데이터의 차이가 작아지도록 학습하는 것을 오차 최소화 관점이라고 한다. 직관적인 방법이며 어떤 방식으로 오차의 크기를 측정할지를 정하면 된다. 대표적인 오차 추정 방식에는 평균제곱오차(MSE), 평균절대오차(MAE)가 있다. 최대우도추정(Maximum Likelihood Estimator) MLE라고 부르기도 하며 먼저 우도(Likelihood)에 대해서 알아야 이해가 간다. 가능도라고 하기도 하며, 간단히 설명하자면 일어날 가능성이 얼마나 되느냐이다. 그러면 최대우도추정이란 이 가능성을 최대로 하는 방..
2023.08.02 -
자코비안 행렬이란 야코비안이나 야코비라고도 불리운다. 이 포스팅에서는 가장 대중적으로 사용되는 자코비안 행렬이라고 칭하겠다. 자코비안 행렬이란 간단히 이야기하면 $f: \mathbb{R}^n \longrightarrow \mathbb{R}^m $ 형태의 벡터 함수 미분을 의미한다. 입력값이 n차원 벡터이고 함수값이 m차원의 벡터인 경우, 입력의 차원별로 함수값의 각 차원을 편미분해서 정의한 행렬이다. $m \times n$의 행렬 형태로 값이 나오며 이를 통해 미소 영역에서 ‘비선형 변환’을 ‘선형 변환으로 근사’ 시킬 수 있다. $$\mathbf{J f} = \left( \begin{array}{ccc} \frac{\partial f_1}{\partial x_1} & \frac{\partial f_1}..
[선형대수학] 자코비안 행렬(Jacobian matrix)자코비안 행렬이란 야코비안이나 야코비라고도 불리운다. 이 포스팅에서는 가장 대중적으로 사용되는 자코비안 행렬이라고 칭하겠다. 자코비안 행렬이란 간단히 이야기하면 $f: \mathbb{R}^n \longrightarrow \mathbb{R}^m $ 형태의 벡터 함수 미분을 의미한다. 입력값이 n차원 벡터이고 함수값이 m차원의 벡터인 경우, 입력의 차원별로 함수값의 각 차원을 편미분해서 정의한 행렬이다. $m \times n$의 행렬 형태로 값이 나오며 이를 통해 미소 영역에서 ‘비선형 변환’을 ‘선형 변환으로 근사’ 시킬 수 있다. $$\mathbf{J f} = \left( \begin{array}{ccc} \frac{\partial f_1}{\partial x_1} & \frac{\partial f_1}..
2023.08.01