武书连|武书连2021世界大学排行榜( 六 )


(2)向上检验准确率和向下检验准确率中有一个达标;
(3)向上检验准确率和向下检验准确率都不达标 。
发生情况(1)时 , 该大学排名不变动 。 发生情况(2)时 , 若向上检验准确率不达标 , 则排名上升;若向下检验准确率不达标 , 则排名下降 。 发生情况(3)时 , 若向下检验准确率大于向上检验准确率 , 则排名上升;向下检验准确率小于等于向上检验准确率 , 则排名下降 。
将所有大学迭代一次后 , 会得到新的排名 , 该新排名称之为S1 。 基于此迭代方式 , 将该初始大学排名S0连续迭代P次 , 使得S0变成SP 。
定义动态平衡状态:对于已迭代P次后的排名SP , 再迭代i次 , SP+i和SP排名相同 , 即SP+i=SP(i≤50) , 则称SP处于动态平衡状态 。
定义收敛:在迭代P次后 , 排名SP达到一个动态平衡状态时 , 将此情况称之为在P次收敛 , 并将SP作为最终结果 。 该最终结果SP称为胜者排名 。
五、算法描述
定义:
SEi是i大学所有论文在7855所大学中 , 被引用总数的排名;
Abs(SEA , SEB)为B大学引用A大学的得分;
Uk是当前排名中第k名的大学 。
1、数据处理中基础得分计算方法
计算任意大学M基础得分Sc时 , 先将大学M的初始基础得分设为0(Sc=0)
对于任意非M的其它大学Q ,
当Abs(SEQ , SEM)和Abs(SEM , SEQ)都不等于0时:
如果Abs(SEM , SEQ)/Abs(SEQ , SEM)>1 , Sc +=1;
如果Abs(SEM , SEQ)/Abs(SEQ , SEM)=1 , Sc +=0;
如果Abs(SEM , SEQ)/Abs(SEQ , SEM)<1 , Sc -=1 。
当Abs(SEQ , SEM)和Abs(SEM , SEQ)中存在0时:
如果Abs(SEM , SEQ)>0 , Abs(SEQ , SEM)=0 , Sc +=1;
如果Abs(SEM , SEQ)=0 , Abs(SEQ , SEM)=0 , Sc -=2;
如果Abs(SEM , SEQ)=0 , Abs(SEQ , SEM)>0 , Sc -=1 。
遍历所有非M的其它大学从而计算出M的最终基础得分Sc 。
2、胜者在前检验方法
定义:Total(T)为被评价的大学总数 , R为检验半径 , M为待检验大学 , N为待检验大学的当前名次 。
? N≤100 , R=N-1;?100 , R=100;? T-99≤N , R=T-N 。
定义:UpError(UE)为在N名次前R个大学中引用待检验大学得分大于被引得分的占比;DownError(DE)为在N名次后R个大学中引用待检验大学得分小于被引得分的占比 。
UE为向上检验错误率(=1-向上检验准确率);DE为向下检验错误率(=1-向下检验准确率) 。
遍历j∈(N , N+R] , I = Uj , 如果Abs(SEi , SEM)>Abs(SEM , SEi)
或者Abs(SEi , SEM)=Abs(SEM , SEi)≠0 , DE Num += 1 。
DE = DE Num /R
遍历j∈[N -R , N) , i = Uj , 如果Abs(SEi , SEM)< Abs(SEM , SEi)
或者Abs(SEi , SEM)= Abs(SEM , SEi)≠0 , UE Num += 1 。
UE = UE Num /R
基于此检验方法 , 每所大学在当前排名都能得出对应的UE和DE
3、迭代方法
根据初始排名S0 , 依次对每所大学做胜者在前检验 。 对任意大学M , 可以获取其当前排名N , 并经过胜者在前检验计算出该大学当前排名的UE和DE 。 此时会出现三种情况:
(1)UE≤0.45 & DE≤0.45;
(2)(UE≤0.45 & DE>0.45)|(UE>0.45 & DE≤0.45);
(3)UE>0.45 & DE>0.45 。
情况(1)该大学排名不动;情况(2)若UE>0.45则排名上升 , 若DE>0.45则排名下降;情况(3)若UE>DE则排名上升 , UE≤DE则排名下降 。
情况(2)迭代方式
UE>0.45:
第一步:UE>0.45则排名上升 , H=N-3;

推荐阅读