유투브 알고리즘 추천은 무슨 기준으로 이루어지나요?
유투브를 보다보면 구독하지 않은 다양한 영상들이 추천으로 올라오는데. 무슨기준으로 선정된건지 궁금합니다. 만약 개인별 검색결과로 분석돼서 나오는거라면 개인정보 보호차원에서 문제가 되는건 아닌지 궁금합니다
유튜브 알고리즘에 대해 정확한 기준은 없습니다.
하지만 YouTube 검색 가능성 높이기라는 Creator Academy에서 공개되어 있는것 처럼 여러가지 요소들을 통해 전반적으로 알고리즘을 계산하는 것으로 알려져있습니다.
크리에이터들은 '알고리즘은 어떤 동영상을 가장 선호하나요?'라고 묻곤 합니다. YouTube 시스템은 크리에이터가 제작하는 동영상의 유형에 대해 아무런 의견이 없으며 특정 형식을 선호하지도 않습니다. 그저 최선을 다해 다음 요소를 살피며 시청자를 따라갈 뿐입니다.
시청자가 보는 것
시청자가 보지 않는 것
시청자의 동영상 시청 시간
'좋아요' 및 '싫어요'
‘관심 없음’ 의견
시중에 유튜브 추천 알고리즘과 저널리즘과 같은 연구 결과가 있으나 이해를 위해 참고할 수 있겠습니다.
개인정보 보호차원에서 문제가 되는지 질문 주셨습니다.
「개인정보 보호법」에서 정의하는 개인정보는 살아 있는 개인에 관한 정보로 아래에 해당하는 정보를 말합니다.
① 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아볼 수 있는 정보
② 해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 정보
③ ①또는 ②를 가명처리함으로써 원래의 상태로 복원하기 위한 추가 정보의 사용, 결합 없이는 특정 개인을 알아볼 수 없는 정보(가명정보)
개인정보 보호에서는 특정 개인을 식별할 수 있는 여부를 중요하게 따집니다.유튜브에서는 식별할 수 있는 주체로서의 이름이나 전화번호, 이메일 등의 정보를 직접적으로 사용하지 않습니다.대신 구글에서 정한 고유의 키를 사용하여 개인을 식별합니다. 따라서 해당 값을 가지고 개인이 누구인지 알아볼 수가 없습니다.
그렇기에 우려하는 개인정보 보호에서 알고리즘 사용에서 자유로울 수 있습니다.
아마 학습기반 데이터애 따라 협업 필터링과 콘탠츠 기반 필터링으로 분류 될수 있을겁니다. 이 두가지 의 장점을 담은 머신러닝 추천 시스템이 적용될수도 있구요 유튜브에서 자체적으로 우린 어떤 추천 알고리즘을 쓴다 라고 밝히고 있지 않기때문에 정확한 알고리즘은 알수가 없습니다.
취향이 비슷한 이용자들을 같은 그룹, 나이대가 비슷한 그룹 등 고객들 데이터를 취합 하여 여러그룹으로 나누고 그에따른 추천이 자동적으로 올라오게 되는 것이죠.
유튜브는 특히 무료 사용자일경우 추천 프로그램이 대부분 광고 수익을 위해 올라오는 경우고 있는데 과거 본 프로그램 , 등 콘텐츠를 기준으로 필터링을 거쳐 추천을 해줄수도 있구요.
유튜브에서 사용된 개임정보라 함은 가입시 제공된 나이 와 평소 보던 취향을 여러 알고리즘 을 통해 추천 해주는것으로 알고있습니다.
구글 서비스의 특징은 알고리즘을 공개하지 않는다는 점입니다. 구글은 유튜브의 알고리즘을 공개하지 않았으며 정확한 알고리즘은 누구도 알 수 없습니다. 다만, 경험으로 볼 때 자주 시청하고 또 오랜 시간 시청하는 컨텐츠를 관심사로 선정하여 관련도가 높은 영상을 추천한 것으로 미루어 짐작하는 정도가 전부인 상황입니다.
추천 알고리즘은 논문으로 연구를 해야할 만큼 방대하고 복잡한 구조로 되어있기 때문에 간단하게 설명하기는 쉽지 않습니다.
특히, 다양한 방법의 조합으로 이루어져 있기 때문에 전반적인 이해를 통해 접근할 필요가 있습니다.
관련해서 2016년도 발표된 논문을 참고해 보시면 좋을것 같습니다.Deep Neural Networks for YouTube Recommendations(2016)
한글은 아래 사이트에서 자세히 설명되어 있으니 참고하시면 좋을것 같습니다 :)
개인별 검색 결과를 기초로 해서
제공이 되는것입니다
하지만 그알고리즘 자체가 회사의 영업기밀이므로
공개되지는 않습니다
동영상 사이트별로 같은 영상 주제를 검색해서
보더라도 결과값은 다를 수밖에없죠
하지만 이걸 개인정보의 역영에 대입을하시면 ㅎ
취향 이나 패턴을 맞추는거라 개인정보 위반이라 볼 수는 없습니다
그리고 무수한 데이터를 다 축적하기도 하지요
유튜브는 알고리즘을 외부에 공개하지 않기 때문에 정확하게 어떤 알고리즘인지는 알 수 없습니다.
일반적으로 추천 알고리즘은 학습 기반 데이터에 따라 콘텐츠 기반 필터링과 협업 필터링으로 나눌 수 있다.
먼저 콘텐츠 기반 필터링은 추천의 기준이 콘텐츠이다. 이용자가 시청한 콘텐츠의 특징을 기준으로 이용자가 선호하는 영상을 파악해, 그에 맞는 콘텐츠를 제공한다.
협업 필터링은 추천의 기준이 콘텐츠가 아닌 사용자이다. 사용자의 나이, 성별, 성향 등을 분석하여 유사한 선호와 취향을 가질 것으로 추정되는 이용자들을 사용자집단으로 설정한다. 이 사용자 집단의 콘텐츠 소비 결과를 바탕으로 이용자에게 콘텐츠를 추천하는 방식이다.
최근 추천 알고리즘은 콘텐츠 기반 필터링과 협업 필터링을 같이 사용하는 하이브리드 방식을 많이 사용하고 있습니다.
안녕하세요. 저는 MICROSOFT공인 MCSE/MCDBA 이며 현재 서버관리, 데이타베이스관리자입니다.
데이터마이닝측면으로 쉽게말씀드린다면 사용자의 경험치에서 나오는영상들입니다. 유투브알고리즘은 사용자가 많이 보고 클릭한내용들을 빅데이터형태로 분석하여 다시 사용자에게 추천해드리는기법입니다.
프로그래밍을 하려고 한다면 당연히 프로그래밍 언어를 배워야하기는 합니다.
컴퓨터 공학과로 진학하기 위해서는 프로그래밍을 할줄 알아야하는 것은 아닙니다.
많은 컴퓨터 공학과 학생들이 프로그래밍 언어를 1학년때 처음 배우는 경우가 많이 있습니다.
처음 배운다면 파이썬으로 시작하는 것을 추천합니다.
다른 언어보다 상대적으로 쉽기 때문에 좋습니다.
"파이썬 정복", "점프 투 파이썬(c언어도 있음)" 등의 책으로 공부해보는 것도 좋을 것 같습니다.