前沿动态
司法文明协同创新中心的建设目标是按照“国家急需、世界一流、制度先进、贡献重大”的要求,依据科学研究、学科建设、资政育人“三位一体”的方针,打造中国乃至世界司法研究的重镇、中国司法学科建设的平台、卓越司法人才培养的基地、司法文明和法治中国建设的核心智库。
李朝:法治评估的类型构造与中国应用——一种功能主义的视角

【中文关键词】 法治环境评估,法治实施评估,法治价值评估,理想类型,功能定位

【摘要】 法治评估类型化是国内学界研究的焦点,但已有的划分标准都有其各自的局限性。在功能主义的分析框架中,可构造“法治环境评估”、“法治实施评估”与“法治价值评估”三种理想类型。三类法治评估在评估主体、评估进路、评估内容及评估方法上存在较大的不同。以往中国评估实践中习惯于忽视法治评估的类型,并多以实质意义上的法治实施评估混淆三类法治评估的内在差别,产生了结构性要素混同、功能期待错位及法治价值评估“实质隐退”等一系列问题。中国法治评估应建立“三类一体”的评估模型,既要进行功能分化,保证不同评估功能的合理使用与精准定位,同时又要对不同法治评估进行功能整合,建立法治评估多类型之间的合作关系,促使法治评估在中国法治进程中落地生根,并成为支援中国法治建设的有力工具。

【全文】    【法宝引证码】 CLI.A.1215595    

      一、问题提出与研究进路 

      几十年来,法治全球化不断提速,法治在人身、财产及秩序方面的保障功能日益为人们所接受,以法治为对象的考察也成为一个跨越国界和地区的国际主题。这种背景之下,法治评估迅速在中国兴起,涌现出大量评估实验,或制定各式各样的指标体系,或援引不同评估技术与方法。然而,法治评估并非只有一种套路,不同项目运作中也呈现多元的、迥然相异的特征。尤其是法治不断朝着多样化发展,法治评估的类型考察也开始为学界所关注。着眼一般意义上的或可类比的划分标准,法治评估的类型划分主要有以下四种观点:

      第一,主体分类说。这种观点认为,根据法治评估的立项和实施主体不同,法治评估可分为政府型法治评估与社会型法治评估两种。[1]其中,政府法治评估主要是由政府主导,出资和组织实施的,如辽宁省法治政府建设评估、上海法治建设评估等。同时也包括政府委托科研院所组织实施的,如杭州市余杭区委委托浙江大学法学院实施的余杭法治指数、中国政法大学组织的中国法治政府评估。社会型法治评估是由第三方发动、组织和实施的,评估主体多为地方组织或跨国机构,如世界银行组织的“世界治理指标”、自由之家组织的“全球自由评估”与“地方转型评估”等。

      第二,进路分类说。这种观点认为,基于评估进路的不同可将法治评估划分为制度性进路法治评估和价值性进路法治评估。[2]制度性进路法治评估是由法治的制度性要素组构法治概念,在制度层面上设计法治指标,凭借这些指标发现法治问题,测量法治水平。余杭法治指数、香港地区法治指数就属于制度性进路,研究者将考察重点放在“政府是否在法律之下行事”;[3]价值性进路是从法治的价值要素出发,考察法治不同价值的组合在不同国家和地区的实现程度,世界正义工程法治指数即属此例。

      第三,内容分类说。这种观点认为,按照评估内容的不同法治评估可分为局部性与全面性法治评估,[4]如余杭法治实验与中国法治政府评估就分属二者。另外,局部性评估虽未直指法治内涵,但因评估内容与法治交叉,可概括为附属性法治评估,如全球廉政指标、自由指数等项目。

      第四,方法分类说。这种观点认为,法治评估可分为定量法治评估与定性法治评估两个类型,[5]定量法治评估通过设置指标并进行赋值计量,以数字形式反映法治的客观属性。定性法治评估更多是借助研究者价值评判去解释法治实践。另有学者提出综合法治评估,实则是将定性与定量方法相结合,借助价值判断审核指标与阐释评估结论。[6]目前,国内外法治评估主要采用定量方法,通过设计指标和权重赋值实现对地方法治的测算,并进行相应的数字排序。

      以上评估类型说,在特定评估项目或者项目某些局部问题上具有一定解释力。但是囿于划分标准多集中于评估的某个形式侧面,实难从总体上解释法治评估多样性,在实践应用中仍有疑义。

评估主体说无法合理区分法治评估的基本类别。之所以将法治评估分为政府型和社会型两种,主要是为了回应评估主体的正当性。然而大多数观点支持社会型评估,认为政府不能担当法治成绩的检验者,否则就成了自我裁判,无法取信于公众,[7]由第三方组织实施才可保证评估的合法性,政府型与社会型评估不是互有优劣、各有所长,而是有所扬弃。

      评估内容说也无法有效区分法治评估的类别。将评估内容划分为全面、局部或特定面向的考察,主要是考虑到单个项目中研究者的志趣、操作与技术有限性以及资金配套等问题,是一种实践层面的权宜之策。据此作出的分类,在评估项目的设立、开启、实施推进的全过程中并无实质不同,甚至在评估结论的效用上也没有大的差别。

      评估进路说有助于理解不同法治评估的差别。评估必须通过法治概念的操作化完成指标设置,而不同评估进路意味着法治概念操作途径的差别,这种差别直接影响到评估的目标定位与实施过程。但是,对法治而言,制度与价值是密不可分的,在制度性进路法治评估中需要建立具有指引性的价值标准,否则评估将缺乏方向性,在价值性进路法治评估中要依赖制度载体,否则法治理念无法转换为可测指标。所以,按照进路划分评估类型,并不能对评估类型作出有区分度的解释。

      评估方法说有助理解不同法治评估的差别。量化方法是实证研究的主流方式,与之相对应的定性方法可理解为另外一种评估方式。但是,现有评估研究多将定性方法界定为对指标的价值判断,将质性方法简单化处理,仅在指标设置和权重分配时以价值标准作出取舍,导致这种分类的实用价值不大。而且,评估方法本身服务于评估目标,受制于研究者的评估意图,仅从方法角度进行划分必然不够完整。

以上四种分类说,反映了法治评估的某些形式差异。借助这些分类标准并进行适当拓展,有助于辨明不同法治评估在结构上的关联与区别,可作为本文中法治评估的类型构造之下的类比要件。事实上我们更需要一个可容纳以上分类合理构想的新视角,将法治评估放在同一个分析框架中,探究不同类型法治评估在应用中的差异与优劣。

      法治发展不是一个“永动机”,而“必须采取果断的行为驾驭它朝着可持续的方向前进”。[8]要干预或引导法治变革,必须借助某种方式对它的状态、特点乃至影响因素有所了解,法治评估就是承担这项工具性功能的一种方法与技术。[9]法治评估是内部各部分良好的整合而成的结构整体,其目标就是服务于自身的功能实现,同时功能特征也是维持评估的结构与形式并主导评估运行的一般性条件。如何真正认识评估如何助推法治建设?又在哪些方面发挥作用?我们应从评估功能入手,明确法治评估的功能类型,查找不同功能的法治评估在应用过程中的异同,并将法治评估的多元功能与中国法治国情进行精准统合。为此,本文以功能主义为视角,在“功能—结构”的分析框架内,对法治评估作出理想型的构造,就不同法治评估的结构与形式差异进行比较,并检讨中国法治评估在类型适用上存在的问题,促使不同功能的法治评估真正在中国落地并发挥实际功用。

      二、法治评估的类型构造——基于域内外评估项目的实证考辨

      功能主义是社会研究的重要分析范式,其中一个核心观点认为功能特征是区分社会事物的重要标尺,孔德、斯宾塞及韦伯的理论学说都谈及这个问题,[10]涂尔干更是借用劳动分工功能与组织分化之间的关系来解释社会分工的生成与演变。[11]结构功能主义学者帕森斯特也曾说过:“任何社会系统都是功能性的实体,功能性决定着系统中具有各种相互依存的结构和过程”,[12]实则将功能差异作为衡量、区别不同社会系统的主要标准。法治评估承担多种功能期待,而功能指向的不同势必也形塑多元的评估类型。为此,借助马克斯·韦伯的理想型分析方法,我们可突出、抽离和简化法治评估中具有典型意义的功能特征,并促使“理想型按照适当的意向构想出来”。[13]

     (一)法治环境评估

      在国际法治评估项目中或可发现,有些评估将视线放在评估地区或国家的法治环境的评判上。比如世界银行主持的世界治理指标(WGI),该项目以“惩罚犯罪”、“合同执行”、“财产和人身权利”、“秩序”为核心测量地方法治水平,[14]考察重点是公众的财产和人身的安全问题,而非地方法治的完整相貌。这也反映世界银行评估项目的功能特征,即评估地区是否能给投资利益提供制度保障、减低贸易与信贷风险。[15]再如世界正义工程(WJP),研究者将公众、行业人士和专家的主观判断作为数据来源,目的是为了从权利主体角度测算地方法治的供给效益。[16]这种作法同样存在于“全球廉政指标(GII)”、“全球自由评估”等多个项目中。

      就此可归纳法治评估的第一种理想型即法治环境评估。在法治环境评估中,法治被赋予公共产品的属性,评估重点是评估地区或国家的法治资源“可定义和可衡量的产出”,[17]以及这种法治供给多大程度上实现对公民或外来利益相关者的权利保障,包括国际商业决策可能遭遇的监管风险和潜在诉讼等。[18]该类评估主要对“公民权利的实现程度”[19]作出描述,提供广泛意义上的“评估清单”,[20]使人们在开展区域或跨区域经济交往抑或政治、文化交流中建立一种“法治秩序”的参照系。

     (二)法治实施评估

      相比法治环境评估,部分法治评估将法治界定为制度实践的结果,[21]主要服务于监督或考核目的。以余杭法治实验为例,评估者参照《中共杭州市委关于建设“法治余杭”的意见》中的“党委依法执政”、“政府依法行政”等九项目标制定考核指标体系,该《意见》中各项任务与目标是否实现或在多大程度上实现成为评估重点,其最终目标也是“通过评估……发现问题、提出建议”。中国法治政府评估以《全面推行依法行政实施纲要》的法治政府建设目标为指引,建立“机构职能及组织领导”、“制度建设和行政决策”等七项维度,并对不同省市的法治建设作出通盘考核。2015年的司法文明指数也提出“为司法文明建设提供一面‘镜子’……为全国和各地司法文明建设具体方案的出台提供实证数据”。[22]当然,将评估聚焦至地方法治建设的作法并不为中国独有,由经济合作组织(OECD)创建的Metagora项目中就包含对法治建设与制度运行的考核与评价。

      可以看出,这种类型的法治评估重视地方法治建设中已设制度、规范及其实施运行的质效,其评估标准来自法治建设的规划与部署,其功能是通过法治的具体实施反映顶层设计与制度落实的差距,透视法治制度化实践中存在的弊端与问题。该评估以法治实施为对象,可将其概括为法治实施评估。[23]对法治实施评估而言,“法治之所‘治’即法治中国的客体,其关键在于公共权力而非人民权利”,[24]通过对公共权力规制的各项制度、措施的落实程度的考察,为法治改革和推进提供详实的实施资讯和建设意见。诚然,部分法治实施评估中也引入了“公众满意度”栏目,如中国法治政府评估中专设“公众满意度调查”评测项,但多停留在“执法中是否存在吃拿卡要”、“是否存在超法定期限办事”等问题上,[25]实际上是从公众角度评价权力规制的成效。

     (三)法治价值评估

      除了以上两种评估,另有一种评估形式,由于其主要围绕法治价值的采集和推广展开,可将其称为法治价值评估。[26]法治价值评估并不直接给法治实施或法治环境提供资讯,而主要承担法治价值的挖掘与传播功能。根据这两种功能,法治价值评估可分为两种,一种可称为原生型法治价值评估,[27]主要负责采集评估地区存在并不断干预法治运行的原生态价值资源。该种评估关注现实生活中起到规约作用的实际规则,那些“未以法律命题形式提出,但却支配生活本身的法律”,[28]包括在法治实践中起到重要作用的习惯法、行业惯例或者其它经验作法是评估焦点。对原生型法治价值评估而言,“评估的目的不是去回答人群的代表性问题……首先的任务为了去理解被研究背景下人们行为建构的意义,从而增加相关知识”,[29]进而丰富和完善评估地区的法治价值系统。

      另一种法治价值评估可称为再生型法治价值评估,[30]其功能主要是传播既有法治价值,增强评估参与者的法治意识。对再生型法治评估而言,评估无意得出对客观事实进行准确描述的结论,相反,能否借助评估过程提高参与者的学习能力,能够让他们建立对法治的普遍认知才是重点所在。目前开展的再生型法治价值评估多并存于国际法治环境评估中。在这些国际项目中,研究者保持一种认知共识即“西方成熟的法治价值特别是权利与责任分化是最有效的,通过对其选择学习,发展中国家可尽快实现法治现代化”。[31]以传播已有法治价值为目标的法治环境评估,其评估过程实际上就是一种再生型法治评估。以美国国际开发署的“民主与治理评估项目(USAID)”为例,该项目宣称“同地方行动者共同合作促进受援国的民主进程”,[32]其提出的法治、政治自由与竞争等评价标准实则是蕴含美国地方风格的价值元素,评估地区或国家接受并认可评估的过程也是拷贝或复制该价值标准的过程。

      纵观而论,法治环境评估重视“公众因法治而实际享有的权利与自由”,并以法治国家内公民或其它利益相关者的“权利资源的可获得性“为评价中心。而法治实施评估则注重“公权机关及其人员因法治而受到的权力规制”,主要通过相关制度配置与运行成效判断公权力是否受到规制以及这种规制在多大程度上可达至预期目标。与前两者相比,法治价值评估的功能多为一种潜在功能,既可用作采集地方伦理价值与文化传统,还可用于传播既有法治价值、观念,实际中有可能超越评估者的预判而“在原有知识中引入了有本质不同的增长”。[33]

      三、法治评估不同类型之比较

      路易斯·沙利文曾提出一个著名的论断叫“形式追随功能”,强调社会需求对事物的功能赋予,而功能特征又决定了事物形式结构的产生、发展与变化,而系统功能类型学有关功能对系统结构的干预与形塑的研究也证实这一点。[34]在法治评估中,评估功能的差异会延伸至评估类型的结构谱系中,对不同法治评估的内在构成产生直接的影响,并使评估的主体、进路、内容及方法各个方面呈现出显著的不同。正如涂尔干在《社会分工论》一书中所指出的“功能差别所带来的形态差别,使功能差别具有更加充分的可感知性”,[35]查找、梳理与归纳法治评估在结构与形式上的异同,有助于我们更好理解不同类型法治评估之间的内在区别。

     (一)法治评估主体

      法治环境评估的主体大多为独立的、非盈利性科研组织或着国际项目援助机构的内设部门。以“全球自由评估”为例,该项目是由由国际非政府组织“自由之家”组织实施。[36]同时,“世界正义工程(WJP)”是由美国律师协会发起的,运营两年后转为非盈利性机构,对世界各国或各地区的法治条件进行考察,旨在推动法治研究,促进全球合作。[37] “世界治理指标(WGI)”是由世界银行开设的,不同于前两者的是“世界治理指标(WGI)”由世界银行为其未来国际投资和解决潜在争端而建立援助项目的,法治指标更多反映跨国商业机构的利益诉求。[38]

与法治环境评估不同,法治实施评估的主体多为政府机构或其下属部门,以及受政府委托与资助的科研院所。以我国法治评估项目为例,有些评估项目是由各地政府或政府部门自行组织的,如四川省政府的《四川省依法治省指标体系(试行)》、辽宁省政府的《辽宁省法治政府建设指标体系》等;同时还有部分项目是由政府委托实施的,如国家“2011计划”司法文明协同创新中心的《中国司法文明指数报告(2014)》等。

与前两者相比,法治价值评估的主体具有更大的灵活性。原生型法治价值评估的主体可以是个体研究者,也可以是跨学科的学术机构,甚至还可以是跨国性学术共同体,围绕评估问题,既可以灵活多变的方式开展小型评估,也可以集合各种力量组织大规模评估项目。而再生型法治价值评估多附随于与之并存的法治环境评估,评估主体多为非政府组织,借助法治环境评估的过程向评估参与者展示并传播法治价值与理念。

     (二)法治评估进路

      法治环境评估多采用价值性进路,以法治价值的要素组合为评估标准。这主要是由于不同国家法治制度千差万别,世界正义工程等跨国法治环境评估在制度层面比较法律体制优劣性缺乏正当依据,其评估的合法基础来自价值超越时空的共通性,即现代法治价值包括形式与实质价值不仅在地区间具有共通性,更与人们对法治的普遍需求与期待内在关联。当然,法治环境评估仍需借助制度变量作为衔接价值标准与经验现实之间的枢纽,但其选用制度变量时更关注制度成立的动机及其服务的价值目标,并借此判断法治资源供给的多寡与优劣。

      与法治环境评估不同,法治实施评估多选用制度性进路。制度性进路将视点放在“现实中确立并运行的各项法治制度或机构”,其评估标准来自评估地区或国家的制度规划与部署。通过制度运作的微观实验,测算法治制度与运行的匹配程度,发现法治实践中的各种问题。此外,“真正有效的规范对社会上人类行为的影响不一定限于执行规范的问题……人们还必须从根本上估计规范到处产生的各种后果”,[39]制度性进路的法治评估并不排斥甚至更需重视制度的治理后果,这也是余杭法治实验、中国法治政府评估等多个项目均设置“公众满意度”指标的缘由。

      与前两者不同,法治价值评估主要采用的是一种折中的、综合性评估进路。[40]在原生型法治价值评估中,评估问题具有密集性,多集中在某些时段、区域或重大法治事件,围绕这些问题展开的评估路径,其操作化步骤、方法选用既涉及到地方法治价值元素,同时也包括地方法治的制度规则与实践经验。在再生型法治价值评估中,公众参与到评估项目中并接受研究者的“培训”,[41]使公众从评估客体转变为评估主体,而理念上的法治价值也必须借助维度上的行为规则及其标准不断输出给公众,帮助他们建立或增强法治信念,这也促成了该评估适用路径的综合性特质。

     (三)法治评估内容

      评估内容是法治评估中最具核心地位的组成部分,无论法治环境评估还是法治实施评估,在内容设置上基本上服从于“概念操作——维度分解——指标设计”的演绎逻辑过程,[42]具有结构设计上的相似性。然而,在每个阶段及不同阶段之间的关系上,二者亦有不同:

      其一,组建法治概念的维度要素不同。法治环境评估以独立又关联的若干法治价值或原则设定评估框架及维度节点。比如“全球自由评估”选择“司法独立”、“法律平等”等价值要素组建法治概念,[43] “世界正义工程(WJP)”参考联合国安理会的法治十项条件,[44]以“远离腐败”、“秩序与安全”等九项价值要素组建标准。而法治实施评估更像是“过去政府法治工作总结和工作部署的某种延续”,[45]在评估地区或国家的顶层设计中抽离若干制度或规范组成分析框架。譬如“中国法治政府评估”将《全面推行依法行政实施纲要》的法治政府建设目标作为标准,以“机构职能及组织领导”、“制度建设与行政决策”等制度形式组建维度,测量法治政府的运行质效。[46]

      其二,实际评测重点不同。“权力规制”与“权利保护”是法治不可分割的两个侧面,但是不同法治评估的重心仍有所差别。法治环境评估认为“法治……给予个体的有利待遇要依靠赋予个体的一系列权利来践行”,[47]将法治视作一项公共产品,通过参与者关于权利保障的法治条件之主观判断,来反馈法治产品的供给程度,并凸显与公众生活密切关联的权利命题。例如,世界正义工程(WJP)在“民事司法”维度之下,提出“民事司法不受歧视干扰”、“民事司法有效执行”等七项指标,[48]这些指标均是围绕司法人权保障可获得性展开的。而法治实施评估更加重视“权力规制”的考察,以代表性法律规范的实践应用审视已有制度是否或在多大程度上禁止公权力的滥用与肆意扩展。比如余杭法治实验的“司法公正”维度中,“超审限案件数”、“陪审员参审率”、“信访案件办结率”等指标都是在检验司法权行使的合法性问题。这种以法治实施质效考核为主的作法在中国地方法治评估项目中应用十分普遍。

      与前两者不同,在原生型法治价值评估的视野中,法治如同“社会世界的情感、语言、符号、互动、政治的方面”一样,来自于人们行动的建构”,[49]法治评估始终围绕着看似独立而又内在关联的法治事件,并在对其追问的过程中“阐明行为意义建构的过程……并对这些意义进行解读”。[50]而对再生型法治价值评估而言,“法治指标不仅反映法治现实,其中更持续扩散着新自由主义的法治常识”,[51]评估内容来自理论层面比较成熟的法治元素、制度层面比较稳定的规则要求,其重点是借助评估形式,传播评估者认同的法治理念,培养与塑就参与者的法治意识,甚至干预参与者的法治行为与判断。

     (四)法治评估方法

      法治环境评估与法治实施评估均采用主流的“量”的研究方法,二者的共同之处主要包括三个方面:其一,建立法治指标模块。两类法治评估均以指标分割法治实践过程,并从中截取核心片段,设立相应的指标体系。其二,进行数字资料回收、整理与复核。两类法治评估收集调研对象的数字资讯,对原始资料进行转换、录入与清理,并通过资料审核剔除无效、无关数据。[52]其三,采用统计分析技术。如果说在指标设计环节无法排除评估者的“价值干预”,那么,在此之后的实施与结论分析环节就必须保持“价值中立”,两类评估均采用单变量分析、相关分析、聚类分析及主成分分析等统计技术,并借此描绘大数据样本中的典型特征与普遍趋势。

      同时,这两类法治评估在方法应用上也有区别:其一,指标类型不同。法治环境评估倚重调查指标,聚焦法治效果的结果评价,其调研对象多为公众、行业人员或专家群体,通过对受访者的看法、感觉和判断等主观状态的测量反馈法治供给程度与成效。而法治实施评估主要依靠间接的统计指标,其指标设计覆盖制度、运行及结果三个方面。其二、数据类别及样本提取方式不同。法治环境评估收集主观数据,是以个体受访者为对象的、以“问与答”为基础的“日常过程向严格测量的转换”得出的,[53]如朱景文的中国法治评估项目全部内容都是通过问卷调研获得数据资料的。[54]而法治实施评估以客观数据为主,多为政府等公权机关提供的绩效或履职资料,并辅助部分调查数据,如余杭法治实验以及湖北、湖南、四川等地评估中常见的“公众满意度”栏目。

      与二者不同,法治价值评估主要采用“质”的研究方法。在法治评估中,质的研究方法既包括传统意义上的观察、访谈和回顾记录,同时也包括以培训、座谈形式展开的对参与者行为的干预。对原生型法治评估而言,“如果说定量社会研究希望通过失败的反驳实验来确保现有的知识纯白,而定性社会研究是要通过吸收尽可能多的个别发现和不同解释来拓宽视角”,[55]运用实地调查、开放式访谈等方式获得法治问题之下参与者行为的意义,最后浓缩为普遍化的理论概念。在再生型法治评估中,评估不是“发现外部世界的普遍规律”,[56]也不是“阐明各种因果效力之间的真实关系”,[57]而是将参与者作为评估主体,借助对不同群体的座谈、培训,使他们建立对法治的基本认识,提高他们在法治方面的自治和自我管理能力。

      四、中国法治评估“类型适用”的实践检讨

      截止至2016年,中国设立法治评估的省份已占全国总数的67.8%,推行法治评估的省份也在逐年增多,2008至2014年期间的年度同比增长均高于50%,[58]其中以测量法治绩效为目标的法治实施评估至少占90%以上。[59]不可否认,法治实施评估在法治中国建设进程中具有独特的贡献。但是,该类型评估在应用是否做到规范和标准化?单凭该评估类型是否足以应对转型期法治改革的多重变化?其中又出现了哪些运行问题?对这一系列问题的追问,还需我们回归到中国法治评估的类型适用实践中作出审视与检讨。

    (一)法治评估的结构要素混同

      “任何一种具体的、作为人们在一定条件下进行的认识活动的结果而存在的知识,都是通过一定的具体结构与形式表现出来的”,[60]不同类型法治评估也有其独特的结构与形式。但是,参鉴国际法治评估经验并进行中国化改造的过程中,法治实施评估与法治环境评估的结构要素却出现部分混同局面。

      第一,主体正当性的混同。在世界正义工程为代表的法治环境评估项目中,评估主体是独立于政府之外的第三方。否则,一旦政府成为评估者,评估者会变成管理者和项目机构的“枪手”,甚至出现“如果控制了资源,你就有可能从指标走向结果”。[61]在这种观点主导下,北京、江苏、四川等地,那些由政府操刀查评的项目因主体与对象的混同、资金来源的官方性毫无例外的受到批评。的确,“评估者不具备足够的方法能力,彼此间缺乏独立性和必要的距离,会过于受项目的影响,无法认识到还有更好的选择途径”。[62]在法治环境评估中,评估主体保持与对象之间的“利益无涉”,才能保证结论的可靠性。然而,在法治实施评估的即时性和快速转换应用的目标之下,评估须满足“迅速并且以最小的消耗完成,评估结果可直接利用”之特征,不依赖政府之外的独立组织,而借助政府纵向科层关系之间的制度规制保持“必要距离”才是有效方式。重要的是,“非盈利性组织的项目经费是由公共或私人的经费资助方提供的”,[63]而资助方更感兴趣的是法治给营商环境或秩序稳定的持续贡献。[64]除了主导法治的官方力量之外,[65]很少有人为地方法治部署的落实与否去“买单”。

      第二,评估内容的标准与重点混同。“评估有两个重要方面:一方面是收集资料,另一方面是整理和鉴别资料的相对价值和标准”,[66]在国际层面的法治环境评估项目中,研究者极少单独提出整理和鉴别资料的价值标准。在借鉴外部经验时,中国法治实施评估沿用这个作法,并按照制度类型对评估主题进行操作化。但是,国内研究者忽视的一点是,法治环境评估是由法治价值要素作为分解维度的,操作化本身本就蕴含价值上的评判标准。而中国的法治实施评估以国家法治建设的制度规划或部署为逻辑起点,其操作化过程并不直接包括价值维度的相关内容。事实上,“采用制度性进路开启的中国法治评估,任何维度与指标的设置都会面临价值上的判断与选择”,[67]但无论余杭、四川、湖北等区域项目还是中国法治政府评估等跨地区项目,普遍缺乏价值维度的设立。

      此外,现行法治实施评估还存有评估重点的混同。法治环境评估以“权利实现”为中心,不同权利种类之间是平等的,并不存在实质的位阶关系,[68]研究者依照总的价值标准对不同种类的权利实现程度进行评估,如自由指数等。中国的法治实施评估是以“权力规制”作为重心的,但仍采用与法治环境评估相同的办法,以一套标准衡量不同领域、不同种类的法治面相。然而,不同权力的法治规制在评判标准和考察重点上存在差别,比如在行政和司法领域,法治政府追求“行政效能的最大化”,而行政效能最大化既包括机构设置合理、管理程序合法化,同时还包括提高效率与降低管理成本,[69]甚至在多个场合中后者更为重要。而司法权体现的是公平正义,不着重于效率、成本等事项,[70]二者在评判标准、重点上无法等量齐观。

      第三,指标或可比性及权重赋分技术混同。在世界正义工程等法治环境评估中,评估者主要采用主观调查指标,这些指标指向公众,把他们对特定现象、事件的判断、感受与看法以数字差异呈现出来。尽管在结论的标准化、准确性上有所降低,[71]但指标的类型、性质、测量层次具有高度的同质性。即便是为获取某些客观讯息,评估者也不再使用如反馈案件审理合理得当的“服判息诉率”等统计指标,而转向由当事人回答“是否认为案件审理得当,不再上诉”等问题,既实现了客观问题的主观化转换,同时又可揭示在息诉之后是否达到真正服判的目标。中国的法治实施评估沿用这种作法,但却选择以统计指标作为数据收集方式,而“统计指标多用来反映各种社会现象的聚焦化程度”,[72]如结案率、上诉率。这些类型的指标在种类、性质上存在较大差异,如上诉率和陪审率,虽然都是对司法公正的测量,但不同指标之间存在性质之别,无法累加或比对。

      法治指标或可比性受阻还延伸出另外一个问题,就是不同指标的权重赋分。权重赋分是指对不同指标设立分值,实现不同指标的累加计分。[73]法治环境评估之所以采用这种技术,前提是指标具有同质性与可比性,而国内法治实施评估在效仿这个技术的同时忽视了这点。以中国法治政府的评估指标为例,“建立行政收费管理制度”、“公开行政服务项目”、“行政审批快捷便民”三项指标中,前两者均属于统计指标,后者属于调查指标,分别反映法治政府的不同侧面,且在法治化程度上均有质的差别,不同指标间缺乏公分母,不具备可通约性,如何确立可接受的赋分标准是一个难以克服的技术难题。当然,近年的司法文明指数、中国法治评估报告开始认识到这个问题,并借鉴世界正义工程“客观问题主观化”方法试图避免此类争议。[74]

     (二)法治评估的功能错置

      党的十八届三中全会明确提出“建立科学的法治建设指标体系和考核标准”,这既是对法治实施评估作出的科学表述,也是对该类评估功能范围的精准限定,即法治实施评估主要对法治建设的成绩与不足进行考核和监督。但是,法治实施评估的功能限定在地方实践却常被扩大解释,并与其它类型评估的功能错置对待。

      首先,混淆法治水平与法治制度运作,进行地方法治排名。国内多个评估项目如余杭法治实验、中国法治政府评估等,大多以测量法治水平并进行法治排名为目标。从技术角度讲,这个功能预设是成立的,这也是法治环境评估的期冀所在。但是,该项功能可否在法治实施单个评估类型内实现还有疑问:其一,法治实施评估与法治环境评估的对象不同。法治实施评估的对象是已设置完毕并投入运行使用的法治制度或规范,而法治环境评估针对的法治水平除了制度规范外,还包括公民法治信仰等多项内容,甚至在制度之外尚且存在法治规范尚未开垦的空白区,是多个面相的法治综合体。倘若将二者等同对待则会抹杀法治内涵的丰富性。其二,法治政绩的计分排名。法治实施评估中,不同面相的法治标准存有差异,法治制度的规划在不同地区也会循时循地出现阶段性差别,忽视这个质的差别而进行数字累加,实则忽略了评估技术的有限性,难以获得高信度的总体结论。正如英国《每日电讯报》评论中所说“独尊GDP……是把进步等同于金钱,忽略了影响广大人民真实生活的真实形势”,法治实施评估为政府精准管理所设立,因政府强干预而带有浓重的官方色彩,用于查摆问题并及时改进当属合理,但据此作出排名难免催生法治GDP背后的地方利益诉求,[75]甚至还可能出现黄宗智所言的“所依赖理念、激励机制与实际效果截然不同”之局面。[76]

      其次,径行划定法治蓝图,规划法治的未来道路。季卫东将法治评估的目标理解为“为改造权力结构提供更清晰的蓝图”,[77]这个定位放在法治环境评估中并无不妥。法治环境评估对象是普通公众,可立足法治受益者,查找不同地区、不同阶层的法治资源供给、分配不平衡问题,可为地方法治的未来规划提供着力重点的提示或指引。但是,这项功能是否可添附至法治实施评估中尚存疑虑。法治实施评估更多是沿着已定法治规划或部署的设计内容、步骤及方法在行进,本身不是在绘制新的,而是在已经绘制完毕的地图上作出涂改或修补,范围限于为法治实施过程中出现的执行问题、履行态势及其间存在的制度缺陷与修正提供资讯,但是在尚未实现法律建制的领域,法治实施评估仍是无力可为的。然而,无论余杭、法治政府还是其它地方法治考核,研究者更期待通过评估在改革深水区探险开道,为法治改革的困惑寻找新出路、新办法。[78]倘若仅凭借法治实施评估为法治部署出谋划策,更可能在传统的、已有的法治道路上“打转转”、“画圈圈”,并不会在其中产生符合中国转型社会需求的新策略、新方案。

      第三、夸大评估的公众参与程度及其对民主法治进程的推动力。世界正义工程等法治环境评估项目将多个利益相关者与公众作为评估对象,借助问卷形式获取反馈意见,公众虽不享有决策权但却获得较多知情权,以咨询者角色参与到评估中。[79]同样,法治价值评估以赋权形式实现“评估权力向公众转移”,公众和评估者成为共同的评估主体,公众参与程度大大加强。有学者就认为法治实施评估同样可提供公众有效参与的平台,如余杭法治实验就提出“民众以外部评估主体的身份参与政府主导的法治评估……培育公民参与法治和民主建设的意识和能力,促进管理过程的民主化”。[80]实际上,法治实施评估本质上是一种“目标—管理”评估模式,主要回答“回答项目、计划和行动措施的特定目标是否和能在多大程度上实现的问题”,[81]即便部分指标涉及公众作答,也仅是让公众从法治体验者的角度验证制度运作绩效,在其间公众并无法成为具有主体性、能动性的参与者,这点在实践中往往为评估者所忽视。

     (三)法治价值评估的“实质隐退”

      从评估研究的发展趋势来看,“评估已不仅是解释项目目标或开放指标体系,而应当有助于提高参与者的能力,使他们对自身状况有更好的理解并能够自我改善”。[82]中国法治实施评估多被烙上实证方法论的“严肃主义”烙印,聚焦于开发指标体系、法治排名或政策评判方面,而评估的“过程性”未受到充分重视,使得承担建构功能的法治价值评估长期处于“实质隐退”的境地。

      首先,原生型法治价值评估缺位,未能及时采集地方法治资源。目前惯用的法治实施评估多以学理通说、政策规划与研究者的学术经验为基础,借助一定的指标工具测量法治绩效。最典型的例子是余杭法治实验,研究者选设法治考核标准,以“政府依法行政”等九组维度进行测量,并在撰写评估报告时提出相应的整改论断。[83]但是,“评估过程并不因写入报告而结束,而应当看作新的开始”,[84]该评估结论是否建立在错误命题上,既设标准是否充分与合理、既有资料是否蕴含着更为深刻的法治伦理,还需借助原生型法治价值评估对数据进行反推验证,并纵向挖掘那些效度偏低或无效的局部指标背后蕴含的、与已设标准相冲突的经验法则。

      然而,在评估实践中,研究者在总结、评判制度落实与执行效能之后,并未采用原生型法治价值评估进一步解读数据背后的法治密码,也未从已有资料讯息中提炼法治的中国知识。例如,中国政法大学政府研究院的法治政府评估中,观测点集中于法治政府绩效考核,结论也是对法治政府规划落实的描述,事关地方治理的实证经验与伦理价值就未在已获资讯基础上继续收集与整理,[85]后续年度评估虽对之前设计的观测点作出修正与增补,但增补讯息更多来自政府的新规划、其他实证项目的思路或观点,尚未从之前评估项目中汲取法治资源并建立一个完整的自生循环评估系统。这种忽视原生型法治价值评估,否认评估功能多元化的作法普遍存在于“司法文明指数”、“湖北法治建设考核指标体系”、“广东省法治建设指标体系”等项目中,实则弱化了评估方法在创建与完善中国特色社会主义法治理论中的现实价值,消耗大量评估成本的同时并未实现评估效能最大化。

     其次,再生型法治价值评估空白,无法有效传播法治核心价值观。十八届四中全会在《全面推进依法治国若干重大问题的决定》中提出“弘扬社会主义法治精神,增强全社会厉行法治的积极性和主动性”,除了推行普法宣传教育之外,再生型法治价值评估因其“强参与性”而成为促进公众参与法治、理解法治与信仰法治的重要途径。再生型法治价值评估本属大卫·费特曼的“赋权评估模式”,强调“通过参与者从评估客体向主体的转换过程,提高参与者的能力,并让他们对自己的状况进行自我改善”。[86]通过再生型法治价值评估,公众可从处于参与类型中较低的“咨询角色”转向较高的“合作角色”,在评估过程中获得对民主法治的全面理解,甚至建立起法治信仰及运用法律维权的基本能力。

      然而,国内研究者并未认识到该类评估方式的传播效能,致使评估无法成为“一种集合诊断、协商与集体治疗的综合体”,[87]并产生了两个不利后果:其一是法治评估不能成为宣传与传播社会主义法治理念的技术平台。较之法治宣传教育的单向输出式特质,再生型法治价值评估是“由评估者对利益相关者或公众进行相应培训,然后由他们自己进行评估”,使公众从“从广泛的参与评估转向对评估承担责任”,[88]在传播法治理念的过程中更尊重与体现公众的自治与能动性,有助于全面普法目标的实现。而现实中法治评估多作为测量法治成效的技术工具,实则限缩了法治评估的构建价值。其二是无法建立起与国外法治评估更为合理的交流与合作关系。以“世界正义工程”为代表的法治评估项目以“测算各国或各地区法治水平,推进全球范围法治进程”的口号下,借用法治价值评估传递带有鲜明美国等西方价值观的法治元素,其实质目标是“核心区国家向半边缘和边缘区国家输出‘标准’,成为固化既有世界格局的一种手段”。[89]而中国却缺乏承载和表述自身特色法治价值的评估载体,以至在面对以评估方式推介西方法治意识形态时缺乏合理手段进行必要应对。美国近期又出台了一个“失败国家指数”,在这个指数中中国排名依然很低,[90]这种价值干预需要引起我们的警惕,也需要我们及时采用更为灵活、有效、方便的手段作出合理回应。

      五、中国特色社会主义法治评估的新探索——三类一体的模型设计

      “中国特色社会主义法治体系是一个复杂开放的系统”,[91]以法治为核心的评估运动不能模仿或简化改造国外评估套路,而是要立足于中国本土法治需求,以评估功能的多元化、评估形式的多样性应对法治中国建设的复杂性。就此,中国法治评估应树立一种创造性转换的思路,既要界明不同类型法治评估的功能与定位,同时也要在不同类型法治评估的分工合作中做到协同创新、携手共进,创建一套既适合法治普遍发展规律又契合中国地方国情与法治需要的评估模式。

     (一)功能分化:法治评估不同模型的结构自洽

      任何评估都无法在单个项目中完成所有预期目标,中国现有法治实施评估项目广受诟病的“功能之混乱与扩张”即为此例。[92]法治评估的差异性功能特征要求精准定位不同评估类型的方法与行动策略,构建不同法治评估的内在结构和运作方式,发挥不同类型法治评估的正向作用。

      第一,建立法治实施评估的类属模型。考虑到法治实施评估旨在即时性的反映法治规划或部署落实成效的“监督性特征”:首先,在评估主体上,可由评估所在地的同级人大及其常委会主导,并由人大及其常委会所委托的科研机构负责实施。我国《宪法》第三条规定人大享有监督权,评估也属于监督宪法与法治实施过程的重要环节,由同级人大及其常委会组织,还可杜绝利益相关者的不当干预,由人大委托科研机构负责实施,又能在最大程度上供给法治实施评估项目以持续开展动力。[93]其次,在价值标准上,“不同的法治指数其实是在不同价值观下评价社会的不同角度”,[94]法治实施评估应以中国特色社会主义法治理念的内涵为核心,建立由“法律至上与法制健全”、“形式平等与程序正当”、“权力规制与权利实现”、“正义与合道德性”组成的四组价值组合,[95]指导评估中维度设置与指标创设,确保操作程序不偏离中国法治建设的基本方向。再次,在评估内容上,法治实施评估的核心在于正确处理法治不同领域乃至同个领域的不同侧面在权力规制标准、方式、程度上的不同,既要在处于中间层级的制度维度层面作出区分,也要在法治指标设计中就考核重点、评价方式选设作出界明。最后,在评估方法与技术上,其一是处理好评估中主客观指标的配比,在采用客观指标测量法治实施效能的同时,利用主观指标复核客观数据的可靠与适用。其二是以反映规范设立状态的制度性指标为基础,以反映法治实施效能的过程性指标和结果性指标为考核重点。其三是借助卡方检验,主成分分析法等统计技术,进行同地区不同指标的描述与不同地区同领域、指标的横向比对分析。

      第二,建立法治环境评估的类属模型。考虑到法治环境评估对法治资源供给程度的“反馈性特征”:首先,在评估主体上,其一是以国内科研院所为评估单位参与国际合作,世界正义工程等项目的实测指标(四级指标)多是考虑评估地区现实情况并与当地部分专家讨论后产生的,[96]国内科研院所应通过协商、合作形式积极参与项目实施,并就其中的中国法治事项作出必要解释,如由中国社科院参与的全球营商环境评估项目就是很好的范例。[97]其二是鼓励国内民间组织独立开展评估项目。目前许多国际法治评估项目是由中立的国际组织作为利益相关者发起的,比如世界银行的全球治理指标等,这种作法可为我们所借鉴,比如国内银行业可就金融市场环境法治化组织相应评估,行业协会也可就本行业的法治秩序及资源供给状况进行评估。其次,在评估内容上,“权利的确定性预设了法律规则的确定性”,[98]以法定权利的实现为评估重点,参照《宪法》第二章的规定,可将权利分解为选举权与被选举权、言论、出版、集会、结社、游行、示威的自由等若干权利项,并在每个权利项下细化权利类属,建立完整的权利分类系统,在结合评估地区现实条件的前提下既可选择部分权利项也可就完整权利项进行评估。再次,在评估方法与技术上,其一是考虑到不同权利类属都汇聚至权利主体身上,以受访者的社会阶层、文化程度、收入、性别等为标准进行立意抽样,保证样本的覆盖面。其二,保持法治指标具有较高效度,无论受访者是否接受法治知识培训或教育,都可理解并回答调研问题。其三,赋分累加排名,法治环境评估不存在指标之间的“质差”,可建立类似于“个人征信制度式”的评价系统,[99]从公众角度审视不同地区的法治水平,并激励法治落后地区不断追赶先进地区。

      第三、建立法治价值评估的类属模型。不管原生型法治价值评估的“凝集群众智慧”,还是再生型法治价值评估的“传播法治理念”,均重视评估项目中的“参与性”特征,这也是十八届五中全会中的“人民主体性原则”在法治评估中的具体呈现:首先,在评估主体上,由法学、经济学、社会学领域的专家学者组成跨专业的评估团队,负责对选定公众与利益相关者进行法治理念的培训,评估者本身仅充当帮助者的角色,在保证参与者对评估项目有较好理解的前提下,由他们自己进行评估,并在评估互动过程中增强对中国法治国情的个体认知。其次,在评估内容上,原生型法治价值评估意在提取中国实际的地方知识与伦理法则,既要主动聚焦至重大、密集法治问题、事件进行纵深挖掘,也要注重借鉴与吸收已有学术研究成果。尤其社科法学中大量微观实证研究同样也在进行法治地方资源的开发,其中的优秀成果理应纳入到评估内容中,实现评估研究成就的“倍增效应”,并通过逻辑验证与理论提升上升至规范乃至理念层面,为法治的“中国特色”提供更好的知识累积。再生型法治价值评估的内容是已确定的、既有的法治价值体系,重点不在于对既定法治价值的批判、研析或改造,而在于通过公众、利益相关者的参与,扩大该价值体系在公众层面的认知与接受度,增强法治信仰、提升法治思维以及运用法律维权的能力。最后,在评估方法上,法治价值评估的方法具有多样性,在多项实证研究中用到的田野观察、结构与无结构访谈、个案延伸、记录回放等技术都可并行使用。

     (二)功能整合:三类法治评估模型的一体化

      在保证不同评估模型各司其职的同时,也要理性认识到不同类型的法治评估各有内在局限。三类法治评估并不是截然孤立的,而是分别瞄准中国法治建设的多维侧面,核查并试图克服中国法治实践面临的不同问题。唯有将三者进行有机统合,塑造多类法治评估的一体化,才能实现不同类型法治评估在功能上的延展性、融合性,使得法治评估始终围绕着法治中国的整体格局展开。

      第一,以法治环境评估为科学参照系,诊断并指引法治实施评估中测量重点的转型。法治环境评估与法治实施评估的主要区别在于前者关注“地区或国家的法治普遍水平”,而后者更重视“地方法治建设的得失”。法治包括政治权力、法律设计与个体行为等多个要素,[100]而“法治建设的规划不可能穷尽关于一个社会中法律活动的全部信息或知识”,[101]后者取得较高的成就并不意味着前者的水平就高。法治评估中既不可将二者简单等同,也不可截断二者的关联。目前,我国学界对参照系的理解多是在方法层面借鉴国外相关项目的指标设计、技术经验,尚未建立结论或评判意义上的参照标准。为此,我们应以反映权利实现为主的中国法治环境评估为基础,诊断法治实施评估指标体系的内在缺陷、指标滞后问题,并根据社会转型的新情势、新需求引导法治实施评估走向科学与合理。

      第二,以法治价值评估创设资源智库,为法治环境\\实施评估提供知识生产。无论法治环境评估,还是法治实施评估多在遵循一种科学主义下的评估逻辑,[102]从理论到经验、从抽象到具体的“三段论”,[103]法治概念界明、维度选取及指标设计来自研究者的理论预设或已有制度类别。在保持自身结构封闭与信度完整的同时,法治指标体系无法自行汲取生活世界中不断涌现的法治资源。特别在周期性法治评估项目中,后续评估往往无法直接援用之前的评估设计方案。而以原生型法治价值评估为载体,可汇集不同学科专家学者的集体智慧及既有经验研究的优秀成果,围绕不同角度、不同选题灵活的进行法治知识的地方生产,建立法治资源的资料库,完善以中国法治为主题的价值、规则知识谱系,并进行实时更新。在进行法治环境\\实施评估时,研究者可根据项目目标与规划,查找资源智库中的最新资料,并纳入到评估项目的构架当中,避免评估受到来自“研究者个人生活经历及其积累的经验”等个体因素的干预。[104]在保证法治实施\\环境评估科学性的同时,使得评估项目保持与时俱进,与不断发展变化的中国法治现实相适应。

      第三,以法治实施\\环境评估为资讯平台,拓展或推广法治价值评估。目前,法治价值评估并非一种显著的评估形式,甚至部分学者带有评估性质的研究尚未归入到法治评估的范畴中。[105]现阶段较成熟的法治实施\\环境评估可有效拓展与推广法治价值评估,并促使该评估类型从“潜性”走向“显性”:[106]其一是以法治实施评估信息公开为基础,拓展原生型法治价值评估的适用范围。法治实施评估是对现行法律制度运行质效的评价,其数据、结论反映出法治实施过程中存在的普遍问题,通过原始数据的复检与结论的复验,可为原生型法治价值评估划定更全面、更合理的切入点,拓宽原生型法治价值评估的评估范围。其二是以法治环境评估为载体,扩大再生型法治价值评估的传播速度与覆盖面。再生型法治价值评估是新鲜事物,单独对其进行试验,不仅受众数量有限而且周期较长,[107]借助正在运行的法治环境评估项目,再生型法治价值评估可在评估过程中,借助与被访者的访谈与问卷调研等形式传播社会主义法治的基本理念与行为准则,虽在公众参与层次上与单独的再生型法治价值评估实验存在一定差距,但在较短时间内会促使大幅公众参与到评估实践中,扩散法治评估的辐射与传递效应,较快提升公众法治意识与能力。

      概言之,“任何具体的、作为人们在一定条件下进行的认识活动,都是在特定的社会情境之中形成的,都与范围有限和确定的认识对象领域相对应”,[108]法治评估亦为如此。本文作出的类型构造,很大程度是为了明晰法治评估的功能指向与限制,将不同功能的实现与法治建设中不断发展变化、多维的现实需求相结合,实现法治评估与法治之间的良性互动。事实上,也只有将不同类型的法治评估嵌入到适合位置,并保持不同类型法治评估之间的分工合作,才有可能打破中国法治评估面临的“南橘北枳”之困局,将法治评估这个来自国外并饱受争议的舶来品真正植入于法治中国的进程中,并给中国法治各项工作的顺利展开提供更为合理、有效的技术支持。

[责任编辑:侯学宾]

【注释】 基金项目:博士后科学基金2015年面上一等资助项目“转型期中国法治评估模式研究”(2015M580169) 

作者简介:李朝(1985-),男,河南驻马店人,西北政法大学刑事法学院教师,中国社会科学院法学所博士后研究人员,法学博士。 

[1]参见钱弘道:《法治评估的实验——余杭案例》,法律出版社2013年版,第329页。 

[2] 参见张德淼、李朝:《中国法治评估进路之选择》,《法商研究》2014年4期。 

[3] 戴耀廷:《香港的法治指数》,《环球法律评论》2007年第6期。 

[4] 参见钱弘道:《中国法治评估的转型》,《中国社会科学》2015年第5期。 

[5] See Maurits Barendrecht and Jin Ho Verdonschot,“Objective Criteria: Facilitating Dispute Resolution by Information about Going Rates of Justice”, Tilburg University Legal Studies Working Paper ,Vol.67,No.011(2008),p.21. 

[6] 参见孟涛:《论法治评估的三种类型——一个法治评估的比较视角》,《法学家》2015年第3期。 

[7] 参见[美]克里福德·科布等:《社会指标的历史教训》,宾建成译,《经济社会体制比较》2011年第5期。 

[8] [德]赖因哈德·施托克曼、沃尔夫冈·梅耶:《评估学》,唐以志译,人民出版社2012年版,第9页。 

[9] 评估研究具有双重性,一方面它是经验研究的一部分,另一方面它也是法治治理过程的一部分,既要遵循科学的标准,又要满足目标群的需求。法治评估是评估的具体形式,围绕法治展开,具有较强的工具性特征。参见[德]赖因哈德·施托克曼、沃尔夫冈·梅耶:《评估学》,唐以志译,人民出版社2012年版,第60页。 

[10] 参见[英]艾伦·斯温杰伍德:《社会学思想简史》,陈玮、冯克利译,社会文献出版社1998年版,第231、232页。 

[11] 参见[法]埃米尔·涂尔干:《社会分工论》,渠东译,三联书店2000年版,第8页。 

[12] 转引自[德]格哈特:《帕森斯学术思想评传》,李康译,北京大学出版社2009年版,第103页。 

[13] [德]马克思·韦伯:《社会学的概念》,胡景北译,上海人民出版社2005年版,第27页。 

[14] See The World Bank,Where is the wealth of Nations?, The World Bank Publish,2006,pp.13-15. 

[15] See Rafael La Porta, Florencio Lopez-de-Silanes ,A Shleifer,RW Vishny,“Legal Determinants of External Finance”, Journal of Finance,Vol.52,No.3(1997),pp.1131-1150. 

[16] See Mark Agrast, Juan Carlos Botero, and Alejandro Ponce, The World Justice Project Rule of Law Index 2011,The World Justice Project Publish,2011,pp.12-16. 

[17] 俞可平主编:《国家治理评估——中国与世界》,中央编译出版社2009年版,第351页。 

[18] Marrs G A,“Battleground over Dual Purpose Documents: Is Work Production Protection Appropriate under Rule 26(B)(3)”, The University IUinois Law Review,No.3(2011),p.1031. 

[19] 汪习根:《法治中国的科学含义》,《中国法学》2014年第2期。 

[20] 同注[8],第161页。 

[21] 参见孟涛:《法治的测量:世界正义工程法治指数研究》,《政治与法律》2015年第5期。 

[22] 张保生、张中、吴洪淇:《中国司法文明指数报告(2014)》,中国政法大学出版社2014年版,第3页。 

[23] 有学者将此类评估概括为“法治建设评估”,这与十八届三中全会《中共中央关于全面深化改革若干重大问题的决定》提出的“建立科学的法治建设指标体系和考核标准”不无关联,但是该种“理想型”法治评估以法治实施过程为对象,以法治实施中利弊得失为突破口,与十八届四中全会《中共中央关于全面推进依法治国若干重大问题的决定》中关于法治实施体系的建设更为契合,考虑定名为法治实施评估为宜。 

[24] 季卫东:《秩序与混沌的临界》,法律出版社2008年版,第56页。 

[25] 法治政府协同创新中心、中国政法大学法治政府研究院:《中国法治政府评估报告(2013)》,未刊稿。 

[26] 之所以称为法治价值评估,是因为该类评估反对公众不在场的实验,主张将“人”的成分纳入到评估中,深入关注在法治背景下人的行为所建构的价值与意义。See Caspari A, Evaluation der Nachhaltigkeit von Entwicklungszu-sammenarbeit, Sozialwissenschaftliche Evaluationsforschung,2004, p.89. 

[27] 原生型价值评估的提取对象孕生于评估地区自身传统和生活场域中,具有与评估地区相伴相生的特征,是一种原生态的地方法治知识。参见[美]克利福德·吉尔兹:《地方性知识:事实与法律的比较透视》,邓正来译,载梁治平主编:《法律的文化解释》,三联书店1994年版,第73页。 

[28] [奥]尤根.埃利希:《法律社会学基本原理》,叶名怡、袁震译,中国社会科学出版社2009年版,第369页。 

[29] [美]C·尼古拉斯.泰勒、C·霍布森.布莱恩、科林·G.·古德里奇:《社会评估:理论、过程与技术》,葛道顺译,重庆大学出版社2009年版,第27页。 

[30] 该种法治价值评估所传播的价值维度多来自既定的、成熟的法治理论,并以价值形式向其他场景迁移,作为实现其功能的手段,故可称为再生型法治价值评估。 

[31] Marc Galanter,“The Modernization of Law”,in Myron Weinered(ed.),Modernization, Basic Books,Inc.,1966,pp.153-165. 

[32] Strengthening Evidence-based Development: Five Years of Better Evaluation Practice at USAID,https://blogs.state.gov/stories/2016/04/14/usaid-continues-deliver-aid-t...年5月3日访问。 

[33] [美]默顿:《社会理论与社会结构》,渠东译,译林出版社2000年版,第124页。 

[34] 参见杨曙、常晨光:《系统功能类型学——类型学之功能视角》,《外语与外语教学》2013年第4期。 

[35] 同注[11],第23页、24页。 

[36] Freedom of the Press 2016,https://freedomhouse.org/report/freedom-press/freedom-press-2016,2016年4月2日访问。 

[37] 参见注[16],第7页。 

[38] See Krever.Tor ,“Quantifying law: legal indicator projects and the reproduction of neoliberal common sense”,Third World Quarterly, Vol.34, No.1(2013)pp.131-150. 

[39] [英]尼尔·麦考密克、[澳]奥塔·魏因贝格尔:《制度法论》,周叶谦译,中国政法大学出版社2004年版,第52页。 

[40] 综合性进路的提法主要是考虑到价值性进路与制度性进路的同源同构关系,是对两种进路的折中,而在法治价值评估中,该类评估并不严格遵循某种评估进路,而是蕴含两种评估进路的核心要素,表现出较强的综合性。参见周尚君、王裕根:《法治指数评估的理论反思与前瞻》,《广州大学学报(社会科学报)》2015年第3期。 

[41] 同注[8],第171-172页。 

[42] 参见张德淼、李朝:《中国法治评估指标体系的生成与演进逻辑——从法治概念到评测指标的过程性解释》,《理论与改革》2015年第2期。 

[43] 参见注[36]。 

[44] Innocent Chukwuma and Eban Ebai, Promoting the Rule of Law through Evaluation and Performance Measurement in Nigeria: Challenges and Prospects, CLEEN Foundation, Innovations in Rule of Law- A Compilation of Concise Essays,The WJP and the Hiu pubish,2012,pp16-20. 

[45] 王称心、蒋立山等主编:《现代化法治城市评价——北京市法治建设状况综合评价指标体系研究》,知识产权出版社2008年版,第79页。 

[46] 同注[25]。 

[47] [意]皮特罗·科斯塔、达尼洛·佐洛主编:《法律的规则:历史、理论及其批评》,田飞龙等译,上海三联书店2015年版,第65页。 

[48] 参见注[37],pp.7-12. 

[49] [美]诺曼·K·邓津、伊冯娜·S·林肯主编:《定性研究:解释、评估与描述的艺术及定性研究的未来》,风笑天等译,重庆大学出版社2009年版,第1054页。 

[50] Schwandt,T.A, Constructivist, interpretivist approaches to human inquiry, Handbook of qualitative researchthousand oaks ca sage,1994,pp.118-137. 

[51] 参见注[38],pp.131-150. 

[52] 参见风笑天:《现代社会调查方法》,华中科技大学出版社2005年版,第150页、第156页、第157页。 

[53] [美]弗洛德·J·福勒:《调查问卷的设计与评估》,蒋逸民等译,重庆大学出版社2010年版,第1页。 

[54] 朱景文主编:《中国法治评估报告(2015)》,中国人民大学法治评估研究中心,2016年4月,未刊稿。 

[55] 同注[8],第256、257页。 

[56] 同注[49] 

[57] 同注[8],第171页。 

[58] 据统计,截止至2016年1月,除了香港、澳门、台湾地区外,共计21个省设立法治评估体系,而且在2008年至2014年出现了地方法治指标体系的设计高峰。 

[59] 国内各地的法治评估指标体系,虽在名称上各有不同,但实质上都是由政府部分或政府委托的科研单位组织开展的,围绕着国家法治纲领与本地的法治规划设计而成,如湖北、四川、山东、贵州等地的评估项目。 

[60] [英]大卫.布鲁尔:《知识和社会意象》,霍桂恒译,中国人民大学出版社2014年版,第13页。 

[61] 同注[7]。 

[62] 同注[8],第89页。 

[63] 同注[8],第327页。 

[64] See The World Bank, Doing Business 2010 China, The Word Bank Publish,2010,p.4. 

[65] 参见周尚君:《地方法治实验的动力机制和制度前景》,《法学研究》2014年第2期。 

[66] Michael Scriven, Evaluation Thesaurus(4 th ed),Sage,1991,pp.4-5. 

[67] 李朝:《自省与重构:中国法治评估若干问题的检讨》,《宏观质量研究》2015年第3期。 

[68] 参见刘作翔:《权利平等的理念、制度与实现》,《中国社会科学》2015年第7期。 

[69] 台湾行政院研究发展考核委员会:《台湾公共治理指标建立之研究》,台湾行政院研究发展考核委员会2008年编印,第11页。 

[70] 参见王申:《司法行政化管理与法官独立审判》,《法学》2010年第6期。 

[71] 主观数据的问题在于被访者的回答具有随意性,容易受到个人情绪、体验和认知局限的干涉,甚至于同个问题在不同时段、不同地点,同个被访者可能出现分歧较大甚至截然不同的回答,这也导致了该类数据缺乏稳定性、准确性。当然,在保证样本总量较大的情况下,这种误差可以实现有效的缩减。 

[72] [苏]伊·彼·苏斯洛夫:《统计指标理论》,陆戈译,黑龙江人民出版社1980年版,第259页。 

[73] 参见张寅:《分析的力量》,中信出版社2015年版,第189、190页。 

[74] 张保生主持的司法文明指数、朱景文主持的中国法治评估均选择以主观指标取代客观指标,实现了对不同地区不同指标的数量累加,目前国内仅此两例完全使用主观指标、调查数据进行测量,避免了指标类型差而引发的争议。参见张保生、张中,吴洪淇:《中国司法文明指数报告(2014)》,中国政法大学出版社2015年版,第55页;朱景文主编:《中国法治评估报告(2015)》,中国人民大学法治评估研究中心,2016年4月,未刊稿。 

[75] 在早期法治评估研究中,就有学者提出根据县际竞争的经济学理论,利用评估GDP排名使地方法治实现一种你追我赶的竞争发展,但是法治不同与经济GDP,其数值的产生,不具有直接性。在指标设计、权重赋值等环节中都存在着研究者价值意图的介入,甚至评估结论的产生也更会受到外界的干预,在县际竞争中反容易产生不当地方利益的表述。参见张五常:《中国的经济制度》,中信出版社2009年版,第158页-168页;钱弘道、戈含锋、王朝霞、刘大伟:《法治评估及其中国应用》,《中国社会科学》2012年第4期。 

[76] 参见黄宗智、龚为纲、高原:《“项目制”的运作机制和效果是“合理化”吗?》,《开放时代》2014年第5期。 

[77] 同注[24],第56页。 

[78] 钱弘道在余杭法治指数的总目标中明确提出要为治理者探明水深水浅、浅滩险湾,认为其可为法治改革提供更多的方向指引,后续评估研究在目标设定中保持谨慎,未明指法治评估的指引作用,但在结论应用中大都就此作出论述。参见钱弘道:《法治评估的实验——余杭案例》,法律出版社2013年版,第66页。 

[79] 谢里·安斯坦将公众参与类型分为“告知”、“咨询”、“安抚”、“合作”、“权力转移”、“公民控制”,这些参与类型之间存在参与程度的差别,且由低向高依次排序。 See Arnstein.S.R,“A Ladder of Citizen Participation”,Journal of the American Institute of Planners,Vo1.35,No.4(1969)pp.216-224. 

[80] 同注[1],第21页。 

[81] 同注[8],第53页。 

[82] Fetterman D.M, Foundations of empowerment evaluation, Sage,2000,pp.3-4. 

[83] 钱弘道等:《中国法治指数报告(2007—2011年)——余杭的实验》,中国社会科学出版社2012版,第255-262页。 

[84] Guba,E.G.and Lincoln,Y.S, Fourth Generation Evaluation, Sage,1989,pp.186-187. 

[85] 评估项目的发展与个体的生命历程非常相似,在经历规划阶段与实施阶段之后,项目还要进入可持续发展阶段,可持续发展孕生着新的评估项目,而后续项目的内容会受到先前项目提供讯息的支持或影响,这种影响也会促使后续的项目走向深入、具体与科学。然而,在中国法治评估实践中,先前评估的积极作用并未对后续项目改革产生直接影响。 

[86] 同注[82]。 

[87] 同注[8],第101页。 

[88] Caspari A, Evaluation der Nachhaltigkeit von Entwicklungszu-sammenarbeit, Sozialwissenschaftliche Evaluationsforschung,2004,p.3. 

[89] 转引自鲁楠:《世界法治指数的缘起与流变》,《环球法律评论》2014年第4期。 

[90] Failed States Index,http://fsi.fundforpeace.org/rankings-2015,2016年4月20日访问。 

[91] 巩献田:《中国特色社会主义法治系统复杂性研究》,《首都师范大学学报》2003年第5期。 

[92] 参见注[67]。 

[93] 这种持续动力包括两个方面:其一是有利于评估的顺利开展;收集官方各类资料的便捷、经费供给的充足、常态化的评估专业队伍等,给评估的开展提供实践上的可行性。其二是包括收集资料、经费供给、队伍配置及评估结论的及时应用等。 

[94] 石佑启、李锦辉:《法治指数背后的价值哲学之争》,《哲学研究》2015年第8期。 

[95] 参见李朝、王华菊:《中国法治评估指标体系的价值基准》,《中国社会科学院研究生院学报》2014年4期。 

[96] 世界正义工程法治指数分为四级指标,其一、二、三级指标是普遍与公开的,第四级指标是由评估方会同评估地区或国家的法律专家,根据评估地区的法律建制与地方实际作出的,在不同国家或地区并不完全一致。See Mark Agrast,Juan Carlos Botero, and Alejandro Ponce, The World Justice Project Rule of Law Index 2011,The World Justice Project Publish,2011,pp.14. 

[97] The World Bank, Doing Business 2010 China, The Word Bank Publish,2010,p.3. 

[98] Constant B, Kloocke K, Trampus A, et al. Commentaire sur l'ouvrage de Filangieri, Gruyter,2012., p.284. 

[99] 黄岚、张晓辉、殷树友:《个人征信系统数据仓库与信用评估模型的构建》,《中国管理信息化(综合版)》2007年第6期。 

[100] 参见注[47],第64-65页。 

[101] 苏力:《法治及其本土资源》,中国政法大学出版社1996年版,第18页。 

[102] 参见注[49],第1051页。 

[103] 参见注[42]。 

[104] 参见陈柏峰:《法律实证研究中的“经验”》,《法学》2013年第4期。 

[105] 目前社科法学中有部分研究直接面向中国法治实践中的种种问题,如陈柏峰对执法问题的研究、在这些研究中,对所关注法治问题的深入评估是随之展开理论探索的基础,而该类与评估关系密切的实证研究往往流失于法治评估之外,未能成为构筑法治评估多元化的科学例证。 

[106] 参见郭亚玲:《由潜功能到显功能:宗教与美国19世纪的社会改革》,《哈尔滨工业大学学报(社会科学版)》2010年第3期。 

[107] 评估项目的周期与评估效益成正相关关系,周期越长,评估预期效益就会随着降低。参见戚安邦主编:《项目论证与评估》,机械工业出版社2009年版,第9页。 

[108] 同注[60]。

 

 

稿件来源:《法制与社会发展》 2016年第5期

网址:http://www.pkulaw.cn/fulltext_form.aspx?Db=qikan&Gid=1510165035&keyword=...

上一条:王红卫 廖希飞:行政诉讼中规范性文件附带审查制度研究 下一条:师安宁:地矿管理行政诉讼中的若干抗辩权问题——不动产司法论坛之二

关闭