(연구에 가까운 글이라 문체가 다소 딱딱할 수 있습니다. 양해 바랍니다. 경어와 존칭은 생략합니다.)
(셀프보팅과 담합보팅 해결책) 기준을 정하기@oldstone은 그의 포스팅 에서 어뷰징을 판별하는 기준을 정하는 것이 불완전하고 악용될 수 있는 인간의 행동을 최소화하고 보다 빠른 합의를 이끄는 길이라고 주장하였다. 필자 역시 그의 주장에 동의하는 바이다. @oldstone은 이어서 스팀파워 보유량에 따른 셀프보팅 비율을 기준으로 삼자고 제안한다. 얼핏 보면 문제해결을 위한 단순하면서도 명료한 방안 같지만 이는 보상을 더 쉽게 더 많이 가져가겠다는 인간의 동기와 그것이 표출되는 복잡한 행동양상을 “셀프보팅”이라는 하나의 행위로 환원한다는 문제가 있다. 즉, 셀프보팅이 아니어도 어뷰징이 가능한 방법이 충분히 존재하며, 이미 이러한 방법들은 도처에서 이루어지고 있다. 만약 셀프보팅만을 기준으로 삼는다면 도리어 어뷰저들에게 면죄부를 주는 결과를 야기할 것이다.
오랜 기간 어뷰저로 인식되어온 계정들의 패턴을 지켜본 결과 필자는 몇 가지 공통적인 사항을 발견하였다. 이 포스팅에서는 그 수치화된 요소들에 대해 검토하고 향후 어뷰징 기준을 세워가는 논의에 디딤돌이 되는 것을 목표로 한다.
1. 셀프보팅
많은 사람들이 얘기했듯이 셀프보팅은 어뷰징 중 가장 명확한 요소이다. 하지만 셀프보팅은 그 자체로 나쁜 것이 아니며 중요한 것은 셀프보팅이 전체 보팅에서 몇 프로나 차지하고 있는지가 중요하다. 높은 비율의 셀프보팅은 타 구성원의 기여를 인정하지 않는다는 의미를 내포하고, 이는 상호작용과 상호평가가 필수적인 커뮤니티의 발전을 저해하기 때문이다. 물론 그 적정 비율에는 논쟁의 여지가 있지만 50% 이상의 셀프보팅에 대해 문제삼는 것에는 이견이 없는 듯하다.
2. Inverse Simpson Index
Inverse Simpson(IS) 지표는 Simpson Index의 역수를 취한 것으로 얼마나 “다양한” 사람에게 보팅을 얼마나 “분배”했는지를 나타내는 지표이다. 이 값이 높을수록 많은 사람에게 공평하게 보팅을 했다는 것이다. 물론 이 값이 무조건 높은 것이 늘 좋지는 않다. 그런 경우는 기계적인 보팅일 경우도 있고, 완벽하게 공평한 보팅은 컨텐츠 필터링에 유익하지도 않다.
이해를 돕기 위해 보팅패턴에 따라 IS지표가 어떻게 변화하는지 살펴보도록 하자.
필자의 경험으로 IS지표는 단기간으로 보면 활용도가 떨어진다. 하지만 30일 이상 장기간을 놓고 봤을 때에는 어뷰저와 일반 사용자 간에 큰 차이를 보이는데 그 이유는 전체 커뮤니티에 대한 열린 보팅을 하고 있는 일반 사용자는 기간이 길어질수록 불특정 다수의 포스팅에 대한 보팅비율이 늘어나기 때문이다. 반면에 특정인만을 대상으로 하고 있는 어뷰저들은 IS지표가 30
이하로 낮은 경우가 많다.
3. Inverse Simpson 지표의 변화
IS지표는 정적인 상태로도 의미를 갖지만 동적인 시각에서 바라볼 때에도 흥미로운 사실을 나타낸다. 어떤 어뷰저들은 IS지표가 높기도 했지만 지표산정 기간을 단기에서 장기로 바꿨을 때 IS값 변화율이 크지 않았다. 반면에 일반 사용자들은 기간이 늘어날수록 IS지표가 증가하는 경향을 보였다. 먼저 일반적인 패턴을 보자. 첫번째 그래프는 7일기준, 두번째 그래프는 30일 기준이다.
극적인 변화는 없지만 상위 보팅의 파이가 조금씩 줄어들고 하위 파이 모음이 증가한 것을 볼 수 있다. 이것의 의미하는 바 역시 앞에서 언급한 것과 동일하게 열린 보팅을 하고 있기 때문이다. 단기적으로는 닫힌 보팅인 것 같아보여도 장기적으로 보면 보다 많은 사람들에게 보팅을 하고 있다는 것이다.
반면에 아래 두 계정(각각 7일, 30일 그래프)을 보면 IS지표값이 거의 차이가 없음을 알 수 있다.
계정1
계정2
4. 일평균 보팅 수
어뷰저는 최대의 수익을 목표로 하기 때문에 대부분의 어뷰저는 1일 10회 풀보팅을 목표로 한다. 하지만 어뷰저가 아닌 사람도 1일 10회의 풀보팅을 목표로 하는 경우가 있다. 이 때 평균 보팅 수는 IS지표의 단점을 보완하는 측면에서 사용될 수 있다. 즉, 보팅을 활발하게 하지 않는 사람의 경우 IS지표가 매우 낮게 나오는데 (기간 내에 1번만 보팅하면 IS지표는 1이다) 이 점에 착안하여 IS지표가 낮더라도 일평균 보팅 수가 적은 계정은 어뷰저로 간주하지 않는 것이다.
5. 상위 보팅계정간의 연관관계
많은 어뷰저들은 상호보팅 관계에 있고, 이를 통해 “셀프보팅”이라는 관문을 쉽게 통과한다. 하지만 이들의 보팅 목록을 보면 상위 10위 정도까지 비슷한 이름이 반복됨을 알 수 있다. 구체적인 부분에 대해서는 더 연구가 필요하겠지만, 상위 10~20개 정도의 보팅 계정 목록을 토대로 네트워크 분석을 한다면 유의미한 군집이 나올 수 있고, 그들간의 담합보팅 비율을 확인할 수 있을 것이다. 참고로 예전에 스팀헬퍼스 문제가 불거졌을 때 필자가 조사한 바로는 10개 계정의 상보보팅 비중이 50~80% 가량이었다.
나가며
어뷰징이 날마다 발전하듯이 어뷰징 기준도 날마다 발전해야 한다. 이는 모든 법과 기준에도 동일한 것이다 (암호화폐가 존재하기에 관련 제도도 생겨나야 하듯이). 이 짧은 연구가 어뷰징에 대한 기준을 세우고 커뮤니티의 공감대를 형성하는데 도움이 되길 소망한다.
숫자로 보면 명확하군요.
블록체인이 참 좋습니다.
이렇게 조사하면 다 나오니까요.
이런게 없었다면 아마 가훈은 정직을 외치면서도
뒤로는 해 먹는 무리들이 판을 쳤겠지요.
이번에도 이명박이 유출 문서가 없었다면 증거가 없었을 거라고 하니...
빨리 모든 분야에 블록체인이 널리 쓰이길 바랍니다.
깔끔한 정리 감사드려요
우아 이런 빅데이터는 어디서 뽑는건가요?? 대단합니다 ^^ @짱짱맨
올해 중순 즈음에 SNS네트워크 분석을 스팀에 이용해보려고 합니다. 물론 계정명은 가린 상태로 진행하겠지만...혹 제가 정보력이 약해서 그러는데 스팀 네트워크 분석 사례가 있나요?
제가 예전에 한게 하나 있습니다.
https://steemit.com/stats/@clayop/the-typology-of-curation-what-kinds-of-curators-we-have-now
감사합니다. 잘 참고해서 도식화까지 진행해보겠습니다.
수치로 표현하니 이해가 빠르네요.
좋은 의견 잘 듣고 갑니다.
셀프보팅에 대한 어느 정도의 제한을 적용하는 것도 좋은 방법이 아닐까 싶습니다.
고생많으셨습니다. 정독하는데 꽤나 걸렸네요. 잘 모르는 말들이라 제가 직접 말하긴 그렇지만 IS 지표라는 것으로, 공평하게 많은 사람들에게 보팅을 했다는 판단을 할 수 있었으면 좋겠습니다. 짧은 연구 잘 읽고 갑니다. 지식도 글도 많이 배워갑니다.
셀봇을 9번을 풀봇하고, 나머지 한번할 양을 1%씩 나눠서 100명에게 보팅하면 vote diversity 차트에 어떤 영향이 있을까요?
미미합니다. 기준이 횟수가 아니라 비율이기 때문이죠.
단순 횟수만이 아니라 파워로도 뽑을 수 있을 걸로 압니다.
여기 보면 보팅 챠트에서 파워로 보는게 있지요.
그 파워로 뽑으면 알 수 있지 않을까요? https://www.steemus.com/UserList.jsp
정확하겐 rshares로 뽑을 수 있습니다
정리 감사드립니다
어뷰저스가 많아짐에 따라서 스팀잇의 위기가 왔다는 걸 실감하게 되네요....
원래 많았는데 그간 모르고, 혹은 알고도 모른 척 한 건 아닌가 싶기도 합니다.
어뷰징이 아닌 모두를 위한 스팀잇이 되었으면 하네요 본질은 소통인데 말이죠.. 돈을 벌 수 있다는 장점이 본질을 퇴색시키는 점이 안되었으면 좋겠네요
이 또한 완벽한 방법은 아닐지라도, 어뷰저를 규정하는 하나의 방법이 될 수 있겠군요!! 단순히 보팅도넛을 보는것 보다 더 효율적인 것 같습니다.
하지만 피드글만 보는 유저의 경우, 기간을 늘린다고 해서 is지표가 크게 증가할것 같지는 않습니다 (뇌피셜입니다)
그렇다면 단지 새로운 크리에이터를 발굴하기 귀찮은 큐레이터는 is지표값만 봤을 때 어뷰저처럼 보일수도 있겠네요
이런식의 논의가 계속되어, 하나의 규칙을 하루빨리 만들었으면 합니다
리스팀이 있습니다
아 그러네요
피드글만 보더라도 리스팀을 통해 피드로 들어오는 크리에이터들을 생각 못했습니다
팔로잉 수에 영향을 받지 않을까 싶습니다. 제 보팅은 대부분 제 피드와 블로그 방문자를 통해 이루어지는데 위 기간의 IS지수가 99입니다. 기계적인 보팅이 아닌데도요.
그러네요. 팔로잉수가 많으면 기간이 늘어날수록 자연스럽게 is지수가 올라가겠네요
좋은 글 감사합니다~ 가능성 있는 지표들, 특히 싱글 계정의 보팅 패턴으로 판단할 수 있는 어뷰징 판단 척도에 대한 이야기라 정말 흥미롭습니다.
개발 요청 글과 연관지어보니 각 요소들의 의미가 이해가 되네요. 연구가 계속 진행되어 클옵님이 제안하시는 지표 외에도 더 많은 지표가 제시되고 논의되는 환경이 만들어지면 좋겠습니다. :)
Simpson이 철자가 맞았네 틀리게 쓰인 줄 알고 드립쳤는데...
이제 본격적인 시작이네요!!
전 오늘로 5일차 뉴비입니다 !!!
가끔 kr 대세글,인기글 보면 제가 보팅수는 더많은데 보팅달러가 잘안찍혀서그런가 저는 못올라가네요... 보팅수는 30개?? 어제올린건 20개 방금넘엇습니다... 그럴땐 살짝 현자타임와요ㅜㅜ 달러찍히는거말고 보팅수로 올라갔으면 좋겟어요
그런게 아무래도 스티밋의 단점으로 지목되는 점이죠.
뉴비는 아무리도 좋은 포스팅을 하려해도 소용없다는 인식을 심어준다는 풍토가 바뀌었으면 합니다.
저도 대세글이나 인기글 한번 올라가고싶네요..ㅋㅋㅋㅋㅋㅋㅋㅋㅋ 아직 많이 부족하긴하지만 ㅜㅜ
어뷰징성격을 가진 셀프보팅, 부계정 보팅, 상호보팅 (짧은 기간 내 몇 회 이상)을 합해 1/3 이상의 기준이면 어떨까요?
50퍼센트 이상은 좀 더 큰 규모의 합의를 이끌어 내거나 최종 어뷰징 판단의 근거로 보는데 확실히 적합할것 같고 개인과 같은 작은 규모에서는 dpos 같은 기민한 단위의 33% 기준이 낫지 않을까 생각합니다.
저도 개인적으론 그정도를 선호합니다. 물론 스파가 높으면 5프로 미만이 되어야한다 봅니다
좋은 분석 잘 읽었습니다. 많은 분들께 도움이 되리라 생각합니다.
다만, 글을 읽으면서 궁금하기도 하고 의구심이 들기도 했습니다 보여주신 데이터를 통해서 어뷰징의 유무를 판단하는 것이 과연 가능한가 라는 생각이 들었습니다.
어떤 분의 보팅 자료인지는 모르겠지만 보팅을 주고 받는 사람 사이의 공통분모가 존재하고, 그 파이가 오랫동안 지속 된다고 해서 꼭 답합보팅을 통해 셀프보팅을 우회했다고 말할 수 있는 건지 개인적으로 확신이 서지 않습니다. 그 사람의 사회적 행동의 경향이나 사회적 그물망 형성의 범위가 좁은 걸 수도 있다는 생각도 들었습니다.
저도 지난 3달간 스팀잇에서 만난 여러 분들 중에 제가 개인적으로 친하다고 느끼는 분들께 더 많이 보팅하는 경향이 있거든요. 그 분들도 제게 보팅을 해주시고요. 저의 이런 경험과 위 데이타가 비슷한 점이 있지 않나.. 그런 생각이 들었습니다.
물론 오랜 경험과 지식으로 좋은 분석을 해주셨다고 생각합니다. 부족한 미견을 적어봅니다.
부디 더 건강한 커뮤니티를 함께 만들었으면 좋겠어요~
즐거운 주말 보내세요!
관계적인 부분을 고려할 수는 있겠지만 그보다 앞서 스팀잇이 하나의 기업이라는 점을 강조하고 싶습니다. 그 관계가 전체 생태계에 해가 된다면 조치가 취해져야 합니다.
처음은 친한사람비중만 높은것처럼 보여도... 사람들을 사귀면서 점점 폭이 넓어집니다...
또 파워가 높아지면 나눠서 쓸 수 있어요... 즉 난 친구와 부계정만 밀어줘 가 아니라면 몰리는 경우는 잘 발생 안해요.
그리고 계산 시 일정 이하 파워는 제외하도록 할 수 있습니다. 뉴비들은 이런거 신경 안 쓰셔도 됩니다.
글 잘보고 가요^^
쉽지는 않네요 숫자로 딱딱 떨어지면 좋겠지만 서두에 말씀하신대로 인간은.... 그렇게 움직이지는 않으니 말입니다 ㅠㅠ 그래도 어느 정도의 기준은 만들어야 할 것이고 그래야 이 스팀잇이라는 공간이 무럭무럭 더 자라날수 있을듯 합니다
도넛을 보는 방법도 여러가지인 셈이로군요. 어뷰징 기준이 잘 잡히면 좋겠습니다 ㅎㅎㅎㅎ
어뷰징 찾는 방법중에 하나가 오픈되었으니 고민하고 계신분들은 '어떻게하면 저기에 안걸리면서 어뷰징을 해야 잘했다고 소문날까' 방법 찾느라 힘드시겠네요.
그분들 그거 찾으시면 제가 또 꿀팁으로 공유해드립니다ㅋㅋㅋㅋ
갑자기 이 짤이 생각나서... ㅎㅎ
지표가 있으니 일단 참고가 되네요.
이렇듯 세세하게 분석해 볼 수 있군요.
어떤 합의가 잘되어야 할텐데, 뮤트를 하고 풀지 않으신 분이 있어서 안타깝습니다.
안녕하세요 clayop 님, 앞으로 어뷰징 기준을 세워가는 논의에 디딤돌이 되는 것을 목표로 하신다는 말씀이 와 닿네요.. 댓글은 보실 수 없으시겠지만 그래도 kr 커뮤니티 일부가 아닌 모두가 공감대가 형성되는 모습을 관심있게 지켜보도록 하겠습니다.
언제나 잘못된 관행이나 습관에 대해 경험상으로 추측으로 주장을 하거나 상대방을 비방하는 행위들은 가장 위험한 것이 아닌가 생각합니다. 데이터을 통해 실제를 기반으로 과거의 통계나 측정된 내용을 보여주면 또 다른 이야기가 되는것이지요. 그런 의미에서 쌓여진 데이터를 가지고 가설과 각각의 속성들을 이리저리 분석해보는 시도와 노력이 참 좋다고 생각합니다.
추측을 대변하는 근거나 될수도 있고 또 새로운 패턴과 원인과 결과를 발견할 수도 있기 때문에요. 포스팅 글 잘 보고 갑니다^^
블록체인의 공개원장이 과연 현재의 사회제도를 제대로 반영할 수 있느냐에 의문을 가져보면서 법률개정과 같은 직간접 선거와 투표의 제도가 도입되어야 현실적인 유용성이 더 증대될 것 같은 생각이 듭니다. 그런 방안을 세울려는 노력없다면 다신 중앙화 서비스들에 흠집만 내고 그냥 좋은 시도였어 라는 식으로 넘어갈 수도 있다고 생각되네요. 스팀잇이 좋은 연구대상이라 지켜보고 있네요.
어뷰징의 개념이 한정적으로만 볼 수 있는 것이 아니었군요. 그런데 문제는 다른 사람의 계정에서 일일이 저것을 다 확인해보고 어뷰징 여부를 알아낼 수 있다는 것이 참 보통 관찰력이 아니면 힘들것 같아요.
관련 자료를 확인할 수 있는 서비스를 @tpdns90321님께서 개발해주고 계십니다.
좋은 정보 감사합니다ᆞ 풀보팅 리스팀 하구 가요~^^
조금씩 조금씩 발전하는 스팀잇이 되는거 같아서 좋습니다.사람마다 옳고 그름에대한 생각과 판단은 다를수있지만, 어느정도 룰과 기준은 있어안하지않나 생각이되는데 그 지표가 될수있는 자료인듯 합니다. 감사합니다.
수고가 많습니다.
말씀하신 대로 '어뷰징이 날마다 발전하듯이 어뷰징 기준도 날마다 발전해야 한다. '
가능하면 발전의 방향을 방어적인 것에 머물지 말고
좀더 능동적으로 밝게 나아가면 어떨까요?
범죄가 생기면 법을 만드는 게 아니라
더 나은 커뮤니티 상(모델)을 많이 발굴하여
공유하는 방향으로....
악화가 양화를 구축하는 게 아니라
양화가 악화를 양화로 만들 게요^^
너무 이상적인가요?
저들을 악으로 규정하고 규탄해도 더 은밀하게 음성적으로 행하는 어뷰징을 부른다면 역효과일 겁니다. 당장 마이너스 스파 임대 같은 제도가 도입되지 않을 거라면 차라리 눈앞에 놓고 감시하고 관리하는 게 낫지 싶습니다. 불법적인 주류 유통망 독점을 눈감아 줄 테니 어디 가서 더 엄한 짓 하지 말고 마을회관에 에어컨도 놔 주고 대학생들 장학금도 나눠 주고 지역 사회에 환원해라 이거죠. 그 비율을 합의하는 논의로 넘어가면 좋겠다는 생각입니다.
일단 하루 보팅 량(10개)을 기준으로 빠르게 걸려내서 스파량을 확인하고 Inverse Simpson(주석에 오타난 것 때문에 simpton으로 잘못 알고 있었음), 셀붓량을 기록한다는 것이랑 초반에 보팅량 기준이 아닌 리워드 보상이 (10개) 들어오는 것을 기준으로 잡는 것으로 둘 중에 뭐가 낫다고 생각하나요?
웨이트를 고려해야해서 보팅량이 중요한데요 10개보다 적을 수도 있기에 넉넉히 일 5회~20회까지는 봐야한다고 봅니다
보상 횟수보단 보팅량을 측정해야한다는 말인가요?
네. Percent를 봐야합니다. 10000이 풀봇 1번이에요.
깔끔하네요.
데이터적인 분석 대단하시네요
어우 전 좀 무서운데요?
정독했습니다. 깔끔한 정리 감사합니다. 냉철하게 보는 데 도움이 많이 되었습니다.
이렇게 표로 볼 수 있다니 판별하기에 좋은데요.
스팀잇이 아무래도 보상과 관계한 곳이라보니 이런 어뷰징문제가 항상 대두되는것 같아요.
그저 멀리 보았음하는 마음입니다.
어뷰징에 대해 논란이 많이 있는 것 같습니다...
모쪼록 빨리 어뷰징 기준을 정해서 분쟁을 종료했으면 좋겠네요
대세글이 분쟁의 장으로 바뀐 것 같아 안타깝습니다..
정리 감사합니다 @clayop님. 어뷰징과 어뷰징 대책은 마치 무엇이든 뚫겠다는 창과 어떤 것에도 뚫리지 않겠다는 방패와의 싸움인것 같은 생각이 듭니다...^^ 다시 한 번 좋은 글 감사드립니다.
나는 네가 한 행동을 모두 다 알고 있다.
블록체인이 이런 기술이라는 것을 사실 스팀잇하기 전에는 단순히 투명성이란 단어로만 이해했는데, 스팀잇에 들어오고 한 달이 지나니 그 투명성이 어떤 것인지 실감하고 있습니다.
투명한 것은 물론이고 고치거나 지울수도 없는 특성... 놀랍습니다.
볼록체인은 정말 이렇게 다 볼 수 있다는점이 장점이자 단점같네요
리스팀해갑니다!
잘 읽고 갑니다
안녕하세요. 플랑크톤입니다. 어떻게보면 그냥 스팀잇 내에 흐르는 미생물일수도 있겠습니다. 최근 제가 스팀잇 가입한 시점에 비해 대세글들과 인기글들이 약간 혼란스럽고 전쟁처럼 보일때가 많은 것은 사실입니다. 그래서 저도 뉴비지만, 많은 고래분들과 선배분들의 글들을 많이 읽고, 논란의 중심이었던 댓글을 실시간으로 지켜보았습니다. 그리고 @clayop님도 kr 커뮤니티에서 질타받으실때도 있고, 어떤 분들은 증인 월급을 kr 커뮤니티에 공정하게 써야하는것 아니냐는 분들도 계셨죠. 개인적으론 말도 안되는 소리지만, 스팀잇은 표현의 자유를 보장하기에.. 그리고 많은 분들이 생각하는 어뷰징 문제. 뉴비의 입장에서 차라리 지금 일어난것이 더 다행이라고 생각합니다. 이렇게 많은 분들이 제도를 만들고, 이 문제를 해결하기에 노력하시는 분들이 많기에, 스팀잇의 미래는 아직 밝다고 생각합니다. 예전 그리스 시대로 따지면, 민주주의로 가기위한 의회를 만드는 과정이라고 생각합니다. 아픔 없이는 성장도 없다고 생각합니다. 많은 분들이 고통과 아픔과 스트레스를 받으시면서 이 커뮤니티를 이끌고 나가시는만큼.. 뉴비들도 함께 힘을 보태어 도울 방법을 찾아보겠습니다. 고래들과 명성높은분들만 이끌어나가기보다는 저희 뉴비도 함께 도울 방법을 모색해 모든 층에서 노력한다면, 스팀잇은 더욱 더 발전하지않을까 싶습니다. 지금 이 글처럼 제도적인 방법적인 룰을 제시하는것도 kr을 위한 노력이라는것을 많은 사람들이 알아줬음 좋겠습니다. 화이팅입니다 @clayop님
감사합니다~^^
시작한지 얼마안되서 궁금한게 많앗는데 재밋는 주제로 글을 잘쓰셧네요 ㅎㅎ
재밋게 잘읽고 갑니다^^
짧은 연구가 아닌 것 같습니다. 뉴비인데 너무 큰 도움 받고 갑니다. 감사합니다!
좋은 글 잘읽었습니다. 저는 오늘이 스팀 첫날인데도 여기저기 구경하다보니 단순히 사진한장 올라온 글에 셀프보팅 여러개 된 모습을 심심치 않게 보았습니다. 건전한 커뮤니티로 발전하기위한 과도기에 있는 모습이 아닐가 합니다. 스팀에서 정말 인생에 도움되는 글 들도 많이 보는데 저는 이 커뮤니티가 멀지않아 sns의 기준이 될거라 믿고있습니다. 여러분의 노력에 감사드리고 저도 계속 즐겁게 활동하겠습니다.
좋은정보 포스팅 감사해요