Doug,<br><br><div class="gmail_quote">On Tue, Jun 9, 2009 at 4:09 PM, Doug Lea <span dir="ltr"><<a href="mailto:dl@cs.oswego.edu">dl@cs.oswego.edu</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="im">Alex Yakovlev wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
entrySet() iterator which is very expensive.<br>
<br>
Very big speedup would be to reuse Entry object,<br>
</blockquote>
<br></div>
We had originally done this in a few classes.<br>
The Iterator spec even allows it. However, most<br>
usages ignore that part of the spec, and it led<br>
to a bunch of bug reports, so now all Entry iterators<br>
for classes using non-Entry-based representations<br>
create new ones. When running on the -server compiler<br>
this is not a huge loss, but it hurts noticeably<br>
using -client. BTW, when checking performance,<br>
do always run both, and also run across multiple<br>
machines. Especially for hash tables, there are<br>
usually interactions with processor-level properties.</blockquote><div><br>FYI: I've run MapCheck with -XX:+DoEscapeAnalysis<br>"Iter Entry" got very significant boost, almost 10x<br>but "Iter EntrySet contains" did not (in source code<br>
entry object is passed into contains method<br>thus cannot be stack-allocated).<br><br>I'll note testing ClientVM too, thanx mentioning it.<br><br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="im"></div>
Still, there probably needs to be a better effort to<br>
approximately match current space consumption in these cases.</blockquote><div><br>I currently have no idea how to do that,<br>anyway this is not a major issue.<br><br>BTW, on your last message on memory consumption,<br>
object header is not one word, I don't remember exaclty<br>but in memory analyzer I saw ~12 bytes header on 32-bit JVM<br>and ~20 bytes on 64-bit.<br><br>Google search says about 8 bytes on 32bit and 16 on 64:<br><a href="http://kohlerm.blogspot.com/2008/12/how-much-memory-is-used-by-my-java.html">http://kohlerm.blogspot.com/2008/12/how-much-memory-is-used-by-my-java.html</a><br>
maybe my data was greater because of alignment.<br> <br>Currently I've changed default capacity from 16 to 4,<br>with 0.75 load factor it's exactly 3 elements you wrote about<br>and total memory is about ~60 bytes, approx. same as current HashMap.<br>
<br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="im"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

    It strikes me that there might be a bigger win available<br>
    here by using some hybrid strategy based on<br>
    IdentityHashMap-like single-indirect (i.e., usually<br>
    at most a single cache miss) for collision-free accesses<br>
    but using a variant of your clever packed-indices<br>
    under collisions. I might try this out someday.<br>

<br>
Interesting, I'm looking forward to see it.<br>
</blockquote>
<br></div>
On a little bit of preliminary exploration, it might<br>
be better yet to use something like ternary tries for<br>
collision/overflow. It might be a while before I get to<br>
this though.</blockquote><div><br>Well. I was curious enough myself to write some<br>proof-of-concept code to test this approach:<br><a href="http://github.com/alex14n/CompactHashMap/blob/8f935e1b5fc7c673e04c93eca2402aada5137b39/java/HybridHashMap.java">http://github.com/alex14n/CompactHashMap/blob/8f935e1b5fc7c673e04c93eca2402aada5137b39/java/HybridHashMap.java</a><br>
<br>There are a lot of to do: Map interface is not implemented,<br>no iterators, no key removal, resize is very slow,<br>management of overflow data can be done several ways, etc.<br><br>But current version shows ~10% performance improvement<br>
in reading existing mappings over both HashMap and my map.<br>Misses are slower but is approximately the same as HashMap.<br><br> </div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="im"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
or you mean iterateFirst/iterateNext methods?<br>
Their only purpose is to simplify LinkedMap and reuse code,<br>
but maybe having different iterators will give some speedup,<br>
but it's just one virtual call - you think it's really that bad?<br>
But hence it could not be inlined by HotSpot...<br>
</blockquote>
<br></div>
Right. Overridden virtual calls inside iterators usually hurt<br>
enough to avoid, but it is worth empirically checking.</blockquote><div><br>I did a bit of testing and there were no significant speedup,<br>but I was testing ServerVM. But I might do it someday anyway.<br> </div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="im"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
 I was thinking if it would be possible to make concurrent<br>
implementation based on AtomicIntegerArray with CAS/retries,<br>
but there are some problems I cannot solve. <br>
</blockquote>
<br></div>
Cliff Click's hash table (<a href="http://sourceforge.net/projects/high-scale-lib/" target="_blank">http://sourceforge.net/projects/high-scale-lib/</a>)<br>
does something along these lines. The tradeoffs involved here<br>
only sometimes seem to win out over current ConcurentHashMap.<font color="#888888"></font><br></blockquote></div><br>Honestly I don't think that array-based approach can<br>be bettter than current concurrent implementation<br>
since there'll be more retries because of more competition<br>over the same array index compared to current possibility<br>just to call new to create new object, so I see no reason even to try.<br>Maybe I'll change my mind over time.<br>
<br>Alex<br>