武书连|武书连2021全世界4000所大学胜者排名 --基于大学论文引用的研究结果( 四 )


排名收敛:排名在迭代一定次数后 , 当不再发生变化或者是达到一个循环变化且步长较小的状态时 , 称之为排名收敛 。
五、胜者在前评价过程
(一)胜者在前检验方法
本次评价中不同排名对应不同检验半径:前100名的检验半径是当前排名减1;后100名的检验半径是被评价大学总数减当前排名;非前后一百名的检验半径是100 。 检验范围是从当前排名减检验半径到当前排名加检验半径 。
对于任何一个大学 , 在检验范围内 , 输给比它当前排名在前的大学数量除以检验半径就是向上检验准确率 , 胜过比它当前排名低的大学数量除以检验半径就是向下检验准确率 。
(二)胜者在前迭代方法
根据初始排名S0 , 依次对每所大学做胜者在前检验 , 获得每所大学基于当前排名的向上检验准确率和向下检验准确率 。 当检验准确率大于等于55%时 , 称之为达标 , 即当前排名不变动 。 此时会出现三种情况:
(1)向上检验准确率和向下检验准确率都达标;
(2)向上检验准确率和向下检验准确率中有一个达标;
(3)向上检验准确率和向下检验准确率都不达标 。
发生情况(1)时 , 该大学排名不变动 。 发生情况(2)时 , 若向上检验准确率不达标 , 则排名上升;若向下检验准确率不达标 , 则排名下降 。 发生情况(3)时 , 若向下检验准确率大于向上检验准确率 , 则排名上升;向下检验准确率小于等于向上检验准确率 , 则排名下降 。
将所有大学迭代一次后 , 会得到新的排名 , 该新排名称之为S1 。 基于此迭代方式 , 将该初始大学排名S0连续迭代P次 , 使得S0变成SP 。
定义动态平衡状态:对于已迭代P次后的排名SP , 再迭代i次 , SP+i和SP排名相同 , 即SP+i=SP(i≤50) , 则称SP处于动态平衡状态 。
定义收敛:在迭代P次后 , 排名SP达到一个动态平衡状态时 , 将此情况称之为在P次收敛 , 并将SP作为最终结果 。 该最终结果SP称为胜者排名 。
六、胜者在前算法描述
定义:
SEi是i大学所有论文在7855所大学中 , 被引用总数的排名;
Abs(SEA , SEB)为B大学引用A大学的得分;
Uk是当前排名中第k名的大学 。
1、数据处理中基础得分计算方法
计算任意大学M基础得分Sc时 , 先将大学M的初始基础得分设为0(Sc=0)
对于任意非M的其它大学Q ,
当Abs(SEQ , SEM)和Abs(SEM , SEQ)都不等于0时:
如果Abs(SEM , SEQ)/Abs(SEQ , SEM)>1 , Sc +=1;
如果Abs(SEM , SEQ)/Abs(SEQ , SEM)=1 , Sc +=0;
如果Abs(SEM , SEQ)/Abs(SEQ , SEM)<1 , Sc -=1 。
当Abs(SEQ , SEM)和Abs(SEM , SEQ)中存在0时:
如果Abs(SEM , SEQ)>0 , Abs(SEQ , SEM)=0 , Sc +=1;
如果Abs(SEM , SEQ)=0 , Abs(SEQ , SEM)=0 , Sc -=2;
如果Abs(SEM , SEQ)=0 , Abs(SEQ , SEM)>0 , Sc -=1 。
遍历所有非M的其它大学从而计算出M的最终基础得分Sc 。
2、胜者在前检验方法
定义:Total(T)为被评价的大学总数 , R为检验半径 , M为待检验大学 , N为待检验大学的当前名次 。
? N≤100 , R=N-1;?100<N<T-99 , R=100;? T-99≤N , R=T-N 。
定义:UpError(UE)为在N名次前R个大学中引用待检验大学得分大于被引得分的占比;DownError(DE)为在N名次后R个大学中引用待检验大学得分小于被引得分的占比 。
UE为向上检验错误率(=1-向上检验准确率);DE为向下检验错误率(=1-向下检验准确率) 。

推荐阅读