百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

JMH基准测试和JMH-Visual-chart可视化

csdh11 2025-03-03 18:11 12 浏览

原文地址:
https://github.com/Sayi/sayi.github.com/issues/68

如何度量一段代码的性能,换种实现方式会有更佳的性能表现吗?你或许想知道fastjson是否正如它自己所说的那样至今性能未遇对手?Fork/Join框架真的有提高性能吗?

一句话:Measure, Don’t Guess!

JMH(Java Microbenchmark Harness)是由OpenJDK Developer提供的基准测试工具(基准可以理解为比较的基础,我们将这一次性能测试结果作为基准结果,下一次的测试结果将与基准数据进行比较),它是一种常用的性能测试工具,解决了基准测试中常见的一些问题,本文将针对这些问题介绍如何正确的使用JMH,以及可视化测试结果。

可视化JMH Visual chart GitHub地址:
https://github.com/Sayi/jmh-visual-chart

字符串拼接性能比较

我们通过基准测试来比较使用"+"号和使用Stringbuilder进行字符串拼接的性能。

1. 创建基准测试项目

我们可以在一个已有项目中运行基准测试,但是为了获得更加准确的度量结果,官方推荐使用Maven archetype来创建独立的JMH项目:

mvn archetype:generate \
          -DinteractiveMode=false \
          -DarchetypeGroupId=org.openjdk.jmh \
          -DarchetypeArtifactId=jmh-java-benchmark-archetype \
          -DgroupId=com.deepoove \
          -DartifactId=hello-mh \
          -Dversion=1.0.0-SNAPSHOT
1234567

这样就创建了一个hello-mh的Maven JMH项目。

2. 编写基准测试代码

package com.deepoove;
import org.openjdk.jmh.annotations.Benchmark;

@BenchmarkMode(Mode.Throughput)
@Measurement(iterations = 2, time = 6, timeUnit = TimeUnit.SECONDS)
@Threads(4)
@Fork(2)
@Warmup(iterations = 1)
@State(value = Scope.Benchmark)
public class MyBenchmark {

  @Param(value = { "10", "50", "100" })
  private int length;

  @Benchmark
  public void testStringAdd(Blackhole blackhole) {
    String a = "";
    for (int i = 0; i < length; i++) {
      a += i;
    }
    blackhole.consume(a);
  }

  @Benchmark
  public void testStringBuilderAdd(Blackhole blackhole) {
    StringBuilder sb = new StringBuilder();
    for (int i = 0; i < length; i++) {
      sb.append(i);
    }
    blackhole.consume(sb.toString());
  }
}
1234567891011121314151617181920212223242526272829303132

这段用到了很多注释,我们姑且不去理会,把重点放在方法级别的注解@Benchmark,JMH会找到@Benchmark注解的方法进行基准测试,方法可以有多个,JMH会依次测试这些方法。

3. 编译和执行基准测试

我们可以通过通过JMH的API来启动基准测试,在MyBenchmark类中增加main方法:

public static void main(String[] args) throws RunnerException {
    Options opt = new OptionsBuilder()
        .include(MyBenchmark.class.getSimpleName())
        .build();

    new Runner(opt).run();
}
}
12345678

如果在运行时报错Exception in thread "main" No benchmarks to run;,需要执行Maven命令进行编译:

mvn clean compile
1

基准测试的结果会在控制台打印出来,一开始就读懂这份结果并不简单,我们先来熟悉下JMH提供的注解和用法。

JMH基准测试

度量模式:@BenchmarkMode

一个最典型最原始的性能度量方式是比较时间差,如下面这段代码所示:

long start = System.currentTimeMillis();
doSomethings(); 
long end = System.currentTimeMillis();
System.out.println("time: " + (end - start) + " milliseconds.");
1234

但是它有一定的问题,System.currentTimeMillis()并不精准,根据不同系统环境会有一定幅度的误差,System.nanoTime()可以提供相对精确的计时,但是也有一定的偏移量,而且只用单次测量的结果作为标准也是不可信的。

JMH提供了注解@BenchmarkMode,可以基于多次度量生成结果:

  • @BenchmarkMode(Mode.Throughput)
    吞吐量,单位时间内执行操作的次数,结果的单位是ops/time。
  • @BenchmarkMode(Mode.AverageTime)
    平均时间,平均每次操作的耗时,结果的单位是time/ops。

还有更多的模式(Mode.SampleTime、Mode.SingleShotTime、Mode.All)可以设置,详情参阅Javadoc。

预热:@Warmup

预热是指让你的测试代码在正式收集数据前先跑一定次数,因为第一次运行包含了类加载和初始化等影响测试结果的过程,所以永远需要预热你的代码,JMH提供注解@Warmup来设置预热参数。

@Warmup(iterations = 5)
1

这行代码表示预热次数为5。

测量方式:@Measurement

JMH是基于多次测量的结果,可以通过注解@Measurement设定多次测量的方式。

@Measurement(iterations = 5, time = 10, timeUnit = TimeUnit.SECONDS)
1

这行代码表示测量5次,每次测量时间为10秒。

循环执行:@Fork

有时候想结合多轮Benchmark的测试结果进行分析,这样就可以用到@Fork注解。

@Fork(2)
1

这行代码表示Benchmark的测试会运行两轮。

参数组合:@Param,@State

我们可能想度量不同参数组合下某个方法的性能表现,这时候就可以使用@Param来列举这些参数值。

@Param(value = { "10", "50", "100" })
private int length;
12

这行代码设置就会依次执行lenght=10,50,100时候的基准测试方法。

如果只是用@Param在编译时会报错,它必须配合@State注解使用,@State指定了对象共享范围。

  • @State(value = Scope.Benchmark):基准测试内共享对象
  • @State(value = Scope.Group):同一个线程组内共享
  • @State(value = Scope.Thread):同一个线程内共享

初始化和销毁:@Setup & @TearDown

假如初始化和销毁代码并不是基准测试的一部分,为了减少测试噪,音所以不应该放到@Benchmark修饰的方法内部,JMH提供了@Setup和@TearDown实现这样的功能。

避免死代码消除DCE:Dead Code Elimination

有时候一段代码最终执行的时候并不是我们看到的那个样子,对于死代码编译器会进行优化。如果我们把字符串拼接的示例代码改成这样:

@Benchmark
public void testStringAdd() {
    String a = "";
    for (int i = 0; i < length; i++) {
        a += i;
    }
}
1234567

JVM可能会认为变量a从来没有使用过,从而进行优化把整个方法内部代码移除掉,显然,这影响了测试结果。

JMH提供了两种方式避免这种问题,一种是将这个变量作为方法返回值return a,一种是通过Blackhole类来消费这个变量:

blackhole.consume(a);
1

避免常量折叠:Constant Folding

当基于常量的操作结果是一定的,JVM也会进行优化,我们看下面的一个例子:

private double x = Math.PI;

private final double wrongX = Math.PI;

@Benchmark
public double baseline() {
    return Math.PI;
}

@Benchmark
public double measureWrong_1() {
    
    return Math.log(Math.PI);
}

@Benchmark
public double measureWrong_2() {
    
    return Math.log(wrongX);
}

@Benchmark
public double measureRight() {
    
    return Math.log(x);
}
1234567891011121314151617181920212223242526

不建议直接引用常量,我们可以通过@State注解类中的变量去引用,就像下面这段代码:

@State(Scope.Thread)
public static class MyState {
    public int a = Math.PI;
}

@Benchmark 
public int testMethod(MyState state) {
    int sum = state.a + 10;
    return sum;
}
12345678910

JMH Visual chart基准测试可视化

解析基准测试结果

我们再次回看字符串拼接基础测试性能结果,可以比较清晰的看到整个分析的过程:


# JMH version: 1.21
# VM version: JDK 1.8.0_131, Java HotSpot(TM) 64-Bit Server VM, 25.131-b11
# VM invoker: /Library/Java/JavaVirtualMachines/jdk1.8.0_131.jdk/Contents/Home/jre/bin/java
# VM options: -Dfile.encoding=UTF-8
# Warmup: 1 iterations, 10 s each 
# Measurement: 2 iterations, 6 s each 
# Timeout: 10 min per iteration 
# Threads: 4 threads, will synchronize iterations 
# Benchmark mode: Throughput, ops/time 
# Benchmark: com.deepoove.MyBenchmark.testStringAdd 
# Parameters: (length = 10) 


# Run progress: 0.00% complete, ETA 00:04:24
# Fork: 1 of 2
# Warmup Iteration   1: 7908426.420 ops/s
Iteration   1: 7257469.806 ops/s
Iteration   2: 8570196.109 ops/s


# Run progress: 8.33% complete, ETA 00:05:09
# Fork: 2 of 2
# Warmup Iteration   1: 7655259.376 ops/s
Iteration   1: 6372627.794 ops/s
Iteration   2: 4954086.450 ops/s


Result "com.deepoove.MyBenchmark.testStringAdd":
  6788595.040 ±(99.9%) 9823071.462 ops/s [Average]
  (min, avg, max) = (4954086.450, 6788595.040, 8570196.109), stdev = 1520131.182
  CI (99.9%): [≈ 0, 16611666.501] (assumes normal distribution)




# Run complete. Total time: 00:05:32

REMEMBER: The numbers below are just data. To gain reusable insights, you need to follow up on
why the numbers are the way they are. Use profilers (see -prof, -lprof), design factorial
experiments, perform baseline and negative tests that provide experimental control, make sure
the benchmarking environment is safe on JVM/OS/HW level, ask for reviews from the domain experts.
Do not assume the numbers tell you what you want them to tell.

Benchmark                         (length)   Mode  Cnt         Score         Error  Units
MyBenchmark.testStringAdd               10  thrpt    4   6788595.040 ± 9823071.462  ops/s
MyBenchmark.testStringAdd               50  thrpt    4   1261762.676 ±  542791.113  ops/s
MyBenchmark.testStringAdd              100  thrpt    4    379271.146 ±   25933.030  ops/s
MyBenchmark.testStringBuilderAdd        10  thrpt    4  18271291.690 ± 7799119.896  ops/s
MyBenchmark.testStringBuilderAdd        50  thrpt    4   2958957.096 ± 1216254.086  ops/s
MyBenchmark.testStringBuilderAdd       100  thrpt    4   1461698.122 ±  499953.566  ops/s
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051

最后六行表明:执行10、50、100次字符串拼接,testStringBuilderAdd在单位时间执行次数都优于testStringAdd。

jmh-visual-chart

jmh-visual-chart支持上传JMH的JSON结果文件然后解析成图表,实现原理很简单,将基准测试的JSON数据转化成图表需要的数据即可。

我们将字符串拼接基准测试代码的main方法改造下,支持JSON文件的输出:

public static void main(String[] args) throws RunnerException {
    Options opt = new OptionsBuilder()
        .include(MyBenchmark.class.getSimpleName())
        .result("result.json")
        .resultFormat(ResultFormatType.JSON)
        .build();

    new Runner(opt).run();
}
123456789

将结果文件result.json上传至jmh-visual-chart生成图表:

总结

JMH是个人人需要掌握的基准测试工具,JMH visual chart这个项目目前处在实验状态,并没有对所有可能的基准测试结果进行验证,目前它能够比较不同参数下不同方法的性能,未来可以无限的扩展JSON to Chart的转化方法从而支持更多的图表。

最后推荐下JMH Visualizer,它是一个功能齐全的可视化项目,只是少了我想要的图表罢了。

参考资料

  • OpenJDK JMH
  • 健壮的 Java 基准测试
  • Java Microbenchmark Harness

相关推荐

探索Java项目中日志系统最佳实践:从入门到精通

探索Java项目中日志系统最佳实践:从入门到精通在现代软件开发中,日志系统如同一位默默无闻却至关重要的管家,它记录了程序运行中的各种事件,为我们排查问题、监控性能和优化系统提供了宝贵的依据。在Java...

用了这么多年的java日志框架,你真的弄懂了吗?

在项目开发过程中,有一个必不可少的环节就是记录日志,相信只要是个程序员都用过,可是咱们自问下,用了这么多年的日志框架,你确定自己真弄懂了日志框架的来龙去脉嘛?下面笔者就详细聊聊java中常用日志框架的...

物理老师教你学Java语言(中篇)(物理专业学编程)

第四章物质的基本结构——类与对象...

一文搞定!Spring Boot3 定时任务操作全攻略

各位互联网大厂的后端开发小伙伴们,在使用SpringBoot3开发项目时,你是否遇到过定时任务实现的难题呢?比如任务调度时间不准确,代码报错却找不到方向,是不是特别头疼?如今,随着互联网业务规模...

你还不懂java的日志系统吗 ?(java的日志类)

一、背景在java的开发中,使用最多也绕不过去的一个话题就是日志,在程序中除了业务代码外,使用最多的就是打印日志。经常听到的这样一句话就是“打个日志调试下”,没错在日常的开发、调试过程中打印日志是常干...

谈谈枚举的新用法--java(java枚举的作用与好处)

问题的由来前段时间改游戏buff功能,干了一件愚蠢的事情,那就是把枚举和运算集合在一起,然后运行一段时间后buff就出现各种问题,我当时懵逼了!事情是这样的,做过游戏的都知道,buff,需要分类型,且...

你还不懂java的日志系统吗(javaw 日志)

一、背景在java的开发中,使用最多也绕不过去的一个话题就是日志,在程序中除了业务代码外,使用最多的就是打印日志。经常听到的这样一句话就是“打个日志调试下”,没错在日常的开发、调试过程中打印日志是常干...

Java 8之后的那些新特性(三):Java System Logger

去年12月份log4j日志框架的一个漏洞,给Java整个行业造成了非常大的影响。这个事情也顺带把log4j这个日志框架推到了争议的最前线。在Java领域,log4j可能相对比较流行。而在log4j之外...

Java开发中的日志管理:让程序“开口说话”

Java开发中的日志管理:让程序“开口说话”日志是程序员的朋友,也是程序的“嘴巴”。它能让程序在运行过程中“开口说话”,告诉我们它的状态、行为以及遇到的问题。在Java开发中,良好的日志管理不仅能帮助...

吊打面试官(十二)--Java语言中ArrayList类一文全掌握

导读...

OS X 效率启动器 Alfred 详解与使用技巧

问:为什么要在Mac上使用效率启动器类应用?答:在非特殊专业用户的环境下,(每天)用户一般可以在系统中进行上百次操作,可以是点击,也可以是拖拽,但这些只是过程,而我们的真正目的是想获得结果,也就是...

Java中 高级的异常处理(java中异常处理的两种方式)

介绍异常处理是软件开发的一个关键方面,尤其是在Java中,这种语言以其稳健性和平台独立性而闻名。正确的异常处理不仅可以防止应用程序崩溃,还有助于调试并向用户提供有意义的反馈。...

【性能调优】全方位教你定位慢SQL,方法介绍下!

1.使用数据库自带工具...

全面了解mysql锁机制(InnoDB)与问题排查

MySQL/InnoDB的加锁,一直是一个常见的话题。例如,数据库如果有高并发请求,如何保证数据完整性?产生死锁问题如何排查并解决?下面是不同锁等级的区别表级锁:开销小,加锁快;不会出现死锁;锁定粒度...

看懂这篇文章,你就懂了数据库死锁产生的场景和解决方法

一、什么是死锁加锁(Locking)是数据库在并发访问时保证数据一致性和完整性的主要机制。任何事务都需要获得相应对象上的锁才能访问数据,读取数据的事务通常只需要获得读锁(共享锁),修改数据的事务需要获...