<p dir="ltr">By the way, just to be clear - my main gripe with the type check is that it loads memory (class pointer in the header) which can take an unnecessary cache miss if no instance data is used or instance data to be used is at least cacheline size bytes away from the header; the cmp+jmp is not ideal but secondary.</p>
<p dir="ltr">sent from my phone</p>
<div class="gmail_quote">On Apr 15, 2015 1:40 PM, "Vitaly Davidovich" <<a href="mailto:vitalyd@gmail.com">vitalyd@gmail.com</a>> wrote:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">So I'm not worried about null checks because they're actually handled really well.  They're also typically a quick test against a register if not using implicit checking via trap.<div><br></div><div>As for propagating type information, I'm assuming this information is propagated into the inlined code only -- if anything fails to inline, it will not receive this information and will perform the same type check, is that right? It's hard to argue against "this is a microbenchmark, larger code won't notice the difference", but when you have code that's "scattered" around (i.e. not all inlined in the same place) then it sounds like this check will still be performed at each of those places.  In a complex call graph, it's not realistic to expect the entire thing to inline (for good reason) -- there are going to be islands.  My thinking here is that given this analysis exists for classes (and works really well), extending it to interfaces (using a heuristic like Remi's, a flag, etc) would be profitable in some places.</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Apr 15, 2015 at 1:02 PM, Vladimir Ivanov <span dir="ltr"><<a href="mailto:vladimir.x.ivanov@oracle.com" target="_blank">vladimir.x.ivanov@oracle.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Nothing changed in 8 & 9 in this respect.<br>
<br>
You are looking on a microbenchmark, where you have a trivial method with contains just a single call. My point is that it's a corner case and you shouldn't notice the difference in a larger application.<br>
<br>
Null checks are pervasive on Java level, but for JIT compiler it is enough to perform it only once on a value to known the value is non-null afterwards.<br>
<br>
The same applies to exact type checks: dominating exact type check eliminates the need to repeat the type check. It is recorded in C2 type system and propagated to all usages.<br>
<br>
Every place where type profiling for that interface happens a single exact type will be recorded.<br>
<br>
Please, note that CHA is more generic and covers the cases when numerous classes have a single method implementation. Type profiling is usually useless in such case.<br>
<br>
But in your example there's a single implementing class, so type profile works fine.<br>
<br>
Best regards,<br>
Vladimir Ivanov<div><div><br>
<br>
On 4/15/15 7:37 PM, Vitaly Davidovich wrote:<br>
</div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div>
Hi Vladimir,<br>
<br>
Here's what I see on 7u60:<br>
<br>
private static int doIt(final Foo f) {<br>
return f.num();<br>
     }<br>
<br>
     interface Foo<br>
     {<br>
int num();<br>
     }<br>
<br>
     final class FooImpl implements Foo<br>
     {<br>
@Override<br>
public int num() {<br>
    return 1;<br>
}<br>
     }<br>
<br>
Running a simple test where only FooImpl is loaded (in fact, it's the<br>
only impl period) produces the following asm (stripped down to essentials):<br>
<br>
   0x00007f0b31e14a6c: mov    0x8(%rsi),%r10d    ; implicit exception:<br>
dispatches to 0x00007f0b31e14a9d<br>
   0x00007f0b31e14a70: cmp    $0x71c9e068,%r10d  ;   {oop('FooImpl')}<br>
   0x00007f0b31e14a77: jne    0x00007f0b31e14a8a<br>
   0x00007f0b31e14a79: mov    $0x1,%eax<br>
   0x00007f0b31e14a7e: add    $0x10,%rsp<br>
   0x00007f0b31e14a82: pop    %rbp<br>
<br>
If I change Foo to be an abstract class, we get this:<br>
<br>
0x00007f0209deb18c: test   %rsi,%rsi<br>
   0x00007f0209deb18f: je     0x00007f0209deb1a2<br>
   0x00007f0209deb191: mov    $0x1,%eax<br>
   0x00007f0209deb196: add    $0x10,%rsp<br>
   0x00007f0209deb19a: pop    %rbp<br>
<br>
So there's an explicit null check but no type check.<br>
<br>
Did something change in java 8 or 9 that leads you to say "completely<br>
eliminated"?<br>
<br>
Thanks<br>
<br>
On Wed, Apr 15, 2015 at 12:26 PM, Vladimir Ivanov<br></div></div><div><div>
<<a href="mailto:vladimir.x.ivanov@oracle.com" target="_blank">vladimir.x.ivanov@oracle.com</a> <mailto:<a href="mailto:vladimir.x.ivanov@oracle.com" target="_blank">vladimir.x.ivanov@<u></u>oracle.com</a>>> wrote:<br>
<br>
    Vitaly,<br>
<br>
    Type profiling reliably detects single interface implementation<br>
    cases and type check overhead is completely eliminated in most of<br>
    the cases (type checks are aggressively commoned).<br>
<br>
    Do you still think it is worth an effort?<br>
<br>
    Best regards,<br>
    Vladimir Ivanov<br>
<br>
<br>
    On 4/15/15 5:10 PM, Vitaly Davidovich wrote:<br>
<br>
        Hi guys,<br>
<br>
        So CHA on classes works nicely in the case of only one subtype<br>
        loaded.<br>
        What about interfaces? Currently, it looks like no such<br>
        optimization/analysis is done.  In my experience, there's a<br>
        substantial<br>
        amount of code that exposes an interface via some API, but then<br>
        loads<br>
        only implementation of it.  The interface is used instead of<br>
        abstract<br>
        class to allow more flexibility in the future.<br>
<br>
        I fully realize that lots of interfaces have more than 1 implementer<br>
        loaded at runtime, but I also think it's worthwhile to attempt<br>
        CHA for them.<br>
<br>
        Is this something that's feasible to do? It would require more class<br>
        loading dependencies to be tracked, but I'm also fine with<br>
        having this<br>
        be an extra flag that I can use to enable/disable this optimization.<br>
<br>
        Thoughts?<br>
<br>
        Thanks<br>
<br>
<br>
</div></div></blockquote>
</blockquote></div><br></div>
</blockquote></div>