<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div><div>On Dec 13, 2012, at 4:29 PM, Vladimir Ivanov wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><span class="Apple-style-span" style="border-collapse: separate; font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; ">I'm not very comfortable with memory state management so far, but I don't see how it differs from "fast" fix. Memory graph seems almost the same between these 2 versions. The only difference is that the check of current thread is after the barrier.<br><br>I'll experiment with converting slow call into uncommon trap and see how it works.<br></span></blockquote><div><br></div><div>As long as there is a non-removable memory barrier (on the relevant memory slice) that dominates the loop backedge, you are good; the loop body will not hoist loads (on that memory slice). &nbsp;Almost any barrier position will work, I think, as long as it is unconditional in the loop (dominates backedge).</div><div><br></div><div>My concern was that (being somehow blinded to your perfectly reasonable membar) the only barrier I could see was buried in the slow call, and that might go away in a strength-reduced loop, for any of a number of reasons. &nbsp;An uncommon trap would do it, and loop unswitching might do it, maybe. &nbsp;That is not a problem, though, in either of your fixes.</div><div><br></div><blockquote type="cite"><span class="Apple-style-span" style="border-collapse: separate; font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><blockquote type="cite">&gt; It seems like your "fast" fix is more robust, for this reason.<br></blockquote></span></blockquote>I take that back!<br><div><br></div><blockquote type="cite"><span class="Apple-style-span" style="border-collapse: separate; font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><blockquote type="cite">&gt; Also, it's not your bug, but I'm not convinced that "slow_val = intcon(1)" is correct. &nbsp;I think another thread could come in and clear the interrupted bit, and this call to the native function could return false.<br></blockquote></span></blockquote><br><blockquote type="cite"><span class="Apple-style-span" style="border-collapse: separate; font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; ">Good catch! You are right, there's a window (though it's very small) when another thread can interrupt the thread. I didn't like known_current_thread variable and now I have a reason to completely remove it :-)<br></span></blockquote><br></div><div>It might be a reasonable optimization, but if it can fail, even infrequently, it should be tested, like this:</div><div><br></div><div>&nbsp; boolean tmp = makeSlowCall(...);</div><div>&nbsp; if (tmp == false) &nbsp;uncommon_trap();</div><div>&nbsp; tmp = true;</div><div><br></div><div>It's not clear that the optimization here is worth much, since it only kicks in if there has been a slow call, and surely the extra test would be noise. &nbsp;The best benefit is that the optimizer can speculate slightly better code after the slow call. &nbsp;The value of this is unclear.</div><div><br></div><div> John</div></body></html>